E Statistic A
E Statistic A
E Statistic A
Itajub/2007
CAPTULO 1 - ESTATSTICA
A essncia da cincia a observao. A cincia que se preocupa com a organizao, descrio, anlise e interpretao dos dados experimentais denominada de Estatstica, um ramo da Matemtica Aplicada. A palavra estatstica provm de Status.
O diagrama seguinte mostra o contexto em que se situa o estudo da Estatstica, aqui subdividido em Estatstica Descritiva e Estatstica Indutiva (ou Inferencial).
Estatstica Descritiva
Amostragem
Clculo de Probabilidade
Estatstica Indutiva
A Estatstica Descritiva est relacionada com a organizao e descrio de dados associada a clculos de mdias, varincias, estudo de grficos, tabelas, etc.. a parte mais conhecida . A Estatstica Indutiva o objetivo bsico da cincia. A ela est associada, Estimao de Parmetros, Testes de Hipteses, Modelamento, etc.. No Clculo de Probabilidades, est a essncia dos modelos No-Determinsticos e a corroborao de que toda inferncia estatstica est sujeita a erros. A Amostragem o ponto de partida (na prtica) para todo um Estudo Estatstico. Estatstica - 1
Aqui pode se ter origem um problema bastante comum em Engenharia: Anlise profunda sobre dados superficiais ! .
1.1.2 - Modelos
Um dos objetivos da anlise de dados buscar um modelo para as observaes. Na figura abaixo, duas variveis esto representadas.
Resduo
Dado
Modelo
Tukey (1977) chama M de parte suave dos dados e R de parte grosseira. A anlise de R to importante quanto a de M. Os modelos podem ser essencialmente determinsticos ou no-determinsticos (probabilsticos ou estocsticos). Nos determinsticos as condies sob as quais um experimento executado determina o resultado do experimento.
Ex.: I pode ser determinado por V/R em um circuito eltrico resistivo elementar.
Estatstica - 2
Ex.: Peas so fabricadas at que x peas perfeitas sejam produzidas; o nmero total de peas fabricadas contado. Usa-se uma distribuio, no caso a Geomtrica, para a tomada de decises
O estudo de qualquer fenmeno, seja ele natural, social, econmico ou biolgico, exige a coleta e a anlise de dados estatsticos. A coleta de dados , pois, a fase inicial de qualquer pesquisa. A Populao a coleo de todas as observaes potenciais sobre determinado fenmeno. O conjunto de dados efetivamente observados, ou extrados, constitui uma Amostra da populao. sobre os dados da amostra que se desenvolvem os estudos, com o objetivo de se fazer inferncias sobre a populao.
Os erros e inconsistncias ocorridos na coleta de dados devem ser corrigidos. As amostras de dados devem ser agrupadas de forma que seu manuseio, visualizao e compreenso sejam simplificados.
Os dados coletados em uma primeira fase podem ser definidos como variveis qualitativas ou quantitativas, de acordo com a seguinte figura:
Estatstica - 3
Ex.: Para uma populao de peas produzidas em um determinado processo, poderamos ter: Varivel Estado: Perfeita ou defeituosa Qualidade: 1a, 2a ou 3a categoria No de peas defeituosas Dimetro das peas Tipo Qualitativa Nominal Qualitativa Ordinal Quantitativa Discreta Quantitativa Contnua
Quando se vai fazer um levantamento de uma populao, um dos passos retirar uma amostra desta populao e obter dados relativos varivel desejada nesta amostra. Cabe Estatstica sintetizar estes dados na forma de tabelas e grficos que contenham, alm dos valores das variveis, o nmero de elementos correspondentes a cada varivel. A este procedimento est associado o conceito de: Dados brutos: o conjunto de dados numricos obtidos e que ainda no foram organizados. Rol: o arranjo dos dados brutos em ordem crescente (ou decrescente). Amplitude (H): a diferena entre o maior e o menor dos valores observados. Freqncia absoluta ( ni ): o nmero de vezes que um elemento aparece na amostra:
n
1
diferentes na amostra.
Freqncia Relativa ( f i ):
fi = ni n
f
i=1
=1
Estatstica - 4
Ex.: Populao = Dimetro de determinada pea (em mm). Dados brutos: { 168, 164, 164, 163, 165, 168, 165, 164, 168, 168 } Rol : { 163, 164, 164, 164, 165, 165, 168, 168, 168, 168 }
H = 168 - 163 = 5
ni 1 3 2 4 10
Ni 1 4 6 10
Fi 0.1 0.4 0.6 1.0 Obs.: Esse tipo de tabela denominada de Distribuio de Freqncias.
Questo: Como implementar um programa computacional que fornea o rol de 2000 valores de uma determinada varivel, de maneira tima?
1.2.3 - Classes
As classes so um artifcio para condensar o nmero de elementos diferentes de uma amostra. Imagine construir uma tabela para 200 valores diferentes, nos moldes do problema anterior? Os principais pr-requisitos para uma boa definio de classes em um conjunto de dados so:
a) As classes devem abranger todas as observaes; b) O extremo superior de uma classe o extremo inferior da classe subseqente (simbologia: , intervalo fechado esquerda e aberto direita); c) Cada valor observado deve enquadrar-se em apenas uma classe; d) k 25, de um modo geral, sendo k o nmero de classes; e) As unidades das classes devem ser as mesmas dos dados. Estatstica - 5
Frmula de Sturges:
N k = 1 + log 2
k N
Obs.: N o nmero de elementos diferentes da amostra e em muitas vezes pode ser considerado N = n
Intervalo da classe (h): h H / k Ponto mdio da classe ( xi ): Ponto mdio entre o limite inferior e o limite
superior de cada classe .
X
10 20 20 30 30 10 40 50 50 60
xi
15 25 35 45 55
ni
2 12 18 13 5 50
i
0.04 0.24 0.36 0.26 0.1 1
%
4 24 36 26 10
Ni
2 14 32 45 50
Fi
0.04 0.28 0.64 0.9 5.0
F%
4 28 64 90 100
Obs.: A partir dos dados que no esto em negrito pode-se montar toda a tabela. Confira!.
1.2.4 - Grficos
Tradicionalmente, uma anlise descritiva dos dados se limita a calcular algumas medidas de posio e variabilidade, como mdia e varincia, por exemplo. Contrria a esta tendncia, uma corrente mais moderna, liderada por Tukey , utiliza principalmente tcnicas visuais, representaes pictricas dos dados, em oposio aos dados numricos. Estatstica - 6
Os principais grficos sero sucintamente descritos a seguir. importante lembrar que os modernos programas computacionais de Edio de Texto, Planilha Eletrnica e Banco de Dados facilitam em muito a manipulao com grficos. Alguns desses programas so: Word, Wordperfect, QuatroPro, Lotus, Dbase, Excell, ...
i ou ni
i ou ni
Histograma alisado
x Classe
As reas dos retngulos so proporcionais s freqncias e o polgono utiliza os pontos mdios das classes. O histograma alisado obtido quando o intervalo da classe diminudo suficientemente para que uma curva contnua possa ser traada. Tal curva muito til para ilustrar rapidamente qual o tipo de comportamento que se espera para a distribuio de uma dada varivel. No captulo referente a variveis aleatrias contnuas, voltar-se- a estudar esse histograma sob um ponto de vista mais matemtico. Ex.: Construo da tabela de distribuio de freqncias a partir do histograma de classes desiguais.
ni 10 8 6 4 2 10 20 30 40 60 x
X 10 20 20 30 30 40 40 60
ni
4 6 10 4 24
fi
4/24 6/24 10/24 4/24 !! 1
Estatstica - 7
Ni,Fi
A ogiva utiliza os pontos extremos das classes e usado em freqncias acumuladas. Tal grfico pode fornecer informaes adicionais por meio de simples operaes grficas.
Ex.: Para um valor de Fi correspondendo a 0.5 (50%) pode-se chegar mediana (~ x ) do conjunto de observaes:
Fi
0,5
~ x
ni fi
Grfico de pontos
x
Para pequena quantidade de elementos.
Grfico em setores
40%
As subdivises so mensurveis.
Grfico em linha
f i , ni
x classe
Alternativo ao grfico, o Ramo-e-Folhas uma boa prtica (sempre que possvel), ao se iniciar uma anlise de dados.Temos aqui:
Ramos
x x x x x x x x x x x Folhas
Ex.: A ingesto diria mdia, per capita, em gramas, de protenas para 33 pases desenvolvidos : 81 113 108 74 79 78 90 93 105 109 95 85 90 94 93 94 86
Construo do ramo-e-folhas:
11 10 9 8 7
3 8 0 1 4 5 3 7 9 9 3 9 8 6 5 9 8 ou 3 0 5 0 4 6 0 0 0 1 1 2 1 3 1 4
11 10+ 109
-
3 8 3 0 1 4 5 0 3 7 9 9 0 3 9 8 6 0 5 9 8 1 0 5 1 4 6 1 0 1 2 3 4
8 7
Estatstica - 10
Exerccios I
01) Os pesos dos jogadores de um time de futebol variam de 75 a 95 quilos. Quais seriam os extremos se quisssemos grup-los em 10 classes? 02) em certa poca, os salrios mensais dos operrios de uma indstria eletrnica variavam de 1.500 a 3.250 unidades monetrias. Quais seriam os extremos se quisssemos gruplos em seis classes? 03) Os nmeros de lugares vagos em vos entre duas cidades foram agrupados nas classes 05 510 1020 2025 2530 30 ou mais. Com esta distribuio possvel determinar o nmero de vos em que h: (a) menos de 20 assentos vagos; (b) mais de 20; (c) ao menos 9; (d) no mximo 9; (e) exatamente 5; (f) entre 10 e 25? 04) Os pontos mdios de uma distribuio de leituras de temperaturas so 16, 25, 34, 43, 52, 61. Determinar os limites de classe e o intervalo de classe. 05) Para agrupar os dados relativos ao nmero de dias chuvosos em julho durante os ltimos 50 anos, um meteorologista utilizou as classes 05, 611, 1216, 1824, 2431. Explique onde pode surgir dificuldades. 06) Construir o histograma para a distribuio de freqncias abaixo: No Empregados 0 10 20 30 40 60 10 20 30 40 60 80 ni 5 20 35 40 50 30 20 20 15 15 Representar o Histograma alisado.
Exerccios I - 1
07)
Para distribuio de freqncia abaixo, construir a ogiva de Galton. Salrios 4,00 8,00 ni 10 12 8 5 1
Aproximadamente, qual o salrio S tal que 50% dos funcionrios ganham menos que S. 08) Os dados abaixo referem-se produo em toneladas, de dado produto, para 20 companhias qumicas (numeradas de 1 a 20). (1,50), (6,500), (11,180), (16,5100), (2,280), (7,250), (12,1000), (17,480), (3,50), (8,200), (13,1100), (18,90), (4,170), (9,1050), (14,120), (19,870), (5,180) (10,240) (15,4200) (20,360)
Exerccios I - 2
Mostram o valor representativo em torno do qual os dados tendem a agrupar-se com maior ou menor freqncia. Mdia Aritmtica simples ( x ) (ou simplesmente mdia)
x1 + x 2 + L + x n = n
x
i =1
x=
x p + x p + L + x n pn x= 1 1 2 2 = p1 + p2 + L + pn pi = peso da amostra xi
xp
i =1 n i
p
i =1
onde,
i
x
x=
i =1 n i =1
ni
i
1 = n
x
i =1
ni = x i f i
i =1
Estatstica - 11
A mdia aritmtica simples pode ser vista como a mdia ponderada com todos os pesos iguais. Para efeito de nomenclatura sempre trataremos a mdia aritmtica simples ou ponderada simplesmente por mdia ( x ).
x) Mediana ( ~
o valor do meio de um conjunto de dados, quando os dados esto dispostos em ordem crescente ou decrescente. Para dados no agrupados em classes:
n + 1 termo Se n mpar ~ x = 2
o
Ex.:
ordem crescente um valor tal que (100 p)% das observaes esto nele ou abaixo dele e 100 (1 - p)% esto nele ou acima dele.
Os percentis de ordem 25,50 e 75 so chamados de quartis. Representam-se por x. Q1, Q2 e Q3. Naturalmente Q2 = ~ Os decis so os percentis de ordem 10, 20, ... 90.
Q1 deixa 25% dos dados (12,5 13 valores) nele ou abaixo dele e 75% dos dados (37,5 38 valores) nele ou acima dele. Assim: Q1 = 63. Similarmente, P80 deixa 80% dos dados (40 valores) nele ou abaixo dele e 20% dos dados (10 valores) nele ou acima dele. Assim: P80 =
90 + 91 = 90,5 2
Obs.: Os programas computacionais usam regras de interpolao para o clculo de percentis e diferem ligeiramente dos valores acima (No Excel, por exemplo, Q1 = 63,25)
Para dados agrupados em classes, os percentis podem ser obtidos por interpolao linear (regra de trs simples). Para P50 = Q2 = ~ x , por exemplo, temos:
( n 2) N a h ~ x = Li + ni
O exemplo a seguir explica os termos desta frmula. Faa a associao!
xi
ni 7 14 18 7
Ni 7 21 39 46
1,810 | 1,822 1,816 1,822 | 1,834 1,828 1,834 | 1,846 1,840 1,846 | 1,858 1,852
1,858 | 1,870 1,864 4 50 Temos que, para ( ~ x ), o 25o elemento (50% de 50), est na terceira classe: Estatstica - 13
n 18 14 8%
~ x
1.846
1.858
1.870
Um outro processo grfico pode ser usado para o clculo desses percentis. (Veja Ogiva de Galton). Tal processo exige rigor no traado e deve-se preferir papel milimetrado.
A Mdia Aparada (ou mdia interna) obtida eliminando do conjunto as m maiores e as m menores observaes. Geralmente, 2,5% m 5% dos dados. Esta eliminao corresponde, na realidade, supresso dos valores extremos - muito altos ou muito baixos. Tal mdia representa um valor entre x e ~ x.
Ex.:
x (m = 1) =
A moda e a classe modal (mo) o valor que representa a maior freqncia em um conjunto de observaes individuais. Para dados agrupados temos a classe modal. Em alguns casos pode haver mais de uma moda. Assim temos uma distribuio bimodal, trimodal, etc...
Ex.:
Estatstica - 14
mo
X 10 | 20 20 | 30 30 | 40 40 | 50 50 | 60
xi 15 25 35 45 55
ni 2 4 10 6 2
Distribuio Bimodal
Classe Modal
mo I
mo II
Quase nunca uma nica medida suficiente para descrever de modo satisfatrio um conjunto de dados. Torna-se ento necessrio estabelecer medidas que indiquem o grau de disperso em relao ao valor central. Nos seguintes conjuntos de dados, por exemplo: A = { 3, 4, 5, 6, 7 } B = { 1, 3, 5, 7, 9 } C = { 5, 5, 5, 5 } D = { 3, 5, 5, 7 } E = { 3.5, 5, 6.5 } F = { -1000, 15, 1000 } Temos em todos eles a mesma mdia. A identificao de cada um desses Estatstica - 15
conjuntos de dados pela sua mdia nada informa sobre as diferentes variabilidades dos mesmas. Algumas medidas que sintetizam essa variabilidade so: Amplitude (H): Como anteriormente definida, H tem o inconveniente de levar em conta somente os dois valores extremos, o maior e o menor deles. Desvio Mdio (DM(x)), Varincia (S2,Var(X) ou 2) e
Desvio Padro (S,DP(X) ou ):
Aqui o princpio bsico analisar os desvios das observaes em relao mdia das observaes. Em A = { 3, 4, 5, 6, 7 },por exemplo, os desvios xi - x so: -2, -1, 0, 1, 2. fcil
ver que a soma dos desvios, identicamente nula e que portanto no serve como medida de disperso:
(x
i =1
x ) = x1 x = n x n x 0
i =1 i =1
i =1
5
xi x = 2 + 1 + 0 + 1 + 2 = 6 x ) = 4 + 1 + 0 + 1 + 4 = 10
2
(x
i =1
DM(x)=
i =1
Estatstica - 16
S2
= i =1
(x
x)
Sendo a varincia uma medida que expressa um desvio quadrtico mdio, conveniente usar uma medida que expresse a mesma unidade dos dados originais. Tal medida o desvio padro S (ou DP(x)), dada por:
S = S2
O uso do DM(x) pode causar dificuldades quando comparamos conjuntos de dados com nmero diferentes de observaes.
Ex.: Em A = { 3, 4, 5, 6, 7 }
temos:
Assim, podemos dizer que, segundo o Desvio Mdio, o Grupo D mais homogneo (tem menor disperso) do que A, enquanto que ambos tem a mesma homogeneidade segundo a varincia. O desvio mdio possui pequena utilizao em estatstica e em geral vale 0.8 vezes o desvio padro
O clculo do desvio padro exige o clculo prvio da varincia e uma frmula alternativa para S2 dada por:
(x
S2 =
i =1
x)
x
=
i =1
x2
(Confira!)
Relacionados inferncia estatstica, alguns autores usam (n - 1) como divisor para a varincia:
(x
S2 =
i =1
x)
n1
Obs.: Muitas calculadoras cientficas possuem duas medidas para desvio padro.
Uma associada diviso por n (simbolizada geralmente por ou n) e outra associada diviso por n - 1 (chamada tambm de no-polarizada, simbolizada geralmente por S ou n-1). Verifique a simbologia usada pela sua calculadora, caso voc possua uma!
( x x)
S =
2 i =1 i
ni ou S 2 =
ou
n
K
2
( x x)
i =1
K
fi
S 2 = xi f i x 2
i =1
S 2 = xi
2
i =1
ni x2 n
x
i =1
t i
(x
i =1
a) t
(x
i =1
x )t
Conforme j vimos nos casos da mdia e da varincia, as expresses precedentes podem ser reescritas levando-se em considerao as frequncias dos diferentes valores existentes. Temos ento respectivamente,
Estatstica - 18
Mt =
x
i =1 n
t i
fi
M ta =
(x
i =1 n
a) t f i n
mt =
(x
i =1
No contexto de um nico conjunto de dados, o desvio padro pode ser interpretado intuitivamente como unidade natural de disperso de dados. Essa interpretao utilizada na construo de escores padronizados de larga utilizao: xi x s
zi =
Grupo
Peso mdio
Desvio Padro
A B
66.5 kg 72.9 kg
6.38 kg 7.75 kg
Nesses grupos h duas pessoas que pesam respectivamente, 81.2 kg e 88.0 kg. Usando o conceito de escore padronizado podemos ver que: Estatstica - 19
em A : em B :
zA = zB =
cv =
S x
cv exprime a variabilidade em termos relativos. uma medida adimensional e sua grande utilidade permitir a comparao das variabilidades em diferentes conjuntos de dados.
Tipo I Tipo II
27,45 147,00
cvI =
2 = 7,29 % 27,45
cv II =
Assim, apesar do Tipo I ser menos resistente, ele mais estvel, mais consistente.
O uso do coeficiente de variao pode ser pensado considerando a questo: Um desvio padro de 10 se a mdia 10.000 bem diferente se a mdia 100! Outros Tpicos: Assimetria e Curtose Box Plots (Mtodo dos cinco nmeros)
Estatstica - 20
Exerccios II
01) Mostre que: (a) (b) (c) (d)
(x
i =1
x) = 0
( x
n i=1 k
i=1 k i
x ) = x nx = x
2 n n i=1 2 1 2 i=1 2 i
i
(x )
i
n (x f (x
i=1 i
x ) = ni x i2 nx 2
2 k
x ) = f i x i2 x 2
2 i=1
i=1 k
02)
a) Construir uma distribuio de freqncia, adotando um intervalo de classe conveniente, o histograma e o polgono de freqncia. Construir o ramo-e-folha. (Sugerem-se classes de tamanho 10, a partir de 10.) b) Calcular a mdia, o desvio padro, a mediana, o 1o quartil e o 65o percentil. c) Resolver (b) graficamente no que couber, com auxlio da ogiva de freqncia acumuladas. 03) Dado o histograma abaixo, calcular a mdia, a varincia, a mediana e o 3o quartil. Sabese que o nmero total de observaes 90.
25
20
15 13
5 4 3 2 3
10
20
30
40
50
60
70
80
90
Exerccios II - 1
04)
Dado o conjunto de observaes 120 107 95 118 150 130 132 109 136
( a ) Determinar os quartis. ( b ) Calcular a mdia aparada com m = 1. ( c ) A mdia aparada praticamente coincide com a mdia aritmtica simples. Por qu? 05) 06) Esboce o histograma de uma distribuio que tenha mdia e mediana iguais. Construir dois conjuntos de dados de mesma amplitude mas com variabilidade diferentes. 07) Por engano, um professor omitiu uma nota no conjunto de notas de 10 alunos. Se as nove notas restantes so 48, 71, 79, 95, 45, 57, 75, 83, 97 e a mdia das 10 notas 72, qual o valor da nota omitida. 08) Em certo ano, uma universidade pagou a cada um de seus 45 instrutores um salrio mdio mensal de R$ 1.500, a cada um de seus 67 assistentes R$ 2.000, a cada um de seus 58 adjuntos R$ 2.600 e a cada um de seus 32 titulares R$ 3.100. Qual o salrio mdio mensal dos 202 docentes? 09) So os seguintes os nmeros de alunos e respectivos QI mdios em trs estabelecimentos de ensino: Estabelecimento A B C No de Alunos 790 155 530 QI Mdio 104 110 106
Qual o QI mdio global dos trs estabelecimentos? Que tipo de mdia foi utilizada? 10) Alega-se que, para amostras de tamanho n = 10, a amplitude amostral deve ser aproximadamente trs vezes o desvio padro. Verifique a alegao com relao aos seguintes dados que representam a velocidade de 10 carros cronometrados em um posto de controle: 97 80 88 62 93 105 74 86 83 (Km/h).
Exerccios II - 2
11)
12)
Tempos, em minutos, de espera numa fila de nibus, durante 13 dias, de um cidado que se dirige diariamente ao seu emprego: 15 10 2 17 6 8 3 10 2 9 5 9 13
Calcular a mdia, a mediante e a moda. 13) Dada a seguinte distribuio de idades dos membros de uma sociedade, Idade 15 20 20 25 25 30 30 35 Calcular: a) x e s; xi 17 22 27 32 ni 16 35 44 27 Idade 35 40 40 45 45 50 50 55 xi 37 42 47 52 ni 17 8 2 1
~, Q , Q ; b) x 1 3
c) o quartil mdio dado por
1 ( Q + Q3 ) ; 2 1
1 ( Q Q1 ) . 2 3
Nota: o quartil mdio s vezes usado como medida de tendncia central em lugar da mdia. O intervalo interquartil e o intervalo semi-interquartil so usados como medidas de variabilidade. 14) Para comparar a preciso de dois micrmetros, um tcnico estuda medidas tomadas com ambos os aparelhos. Com um mediu repetidamente o dimetro de uma pequena esfera de rolamento; as mensuraes acusam mdia de 5,32 mm e d.p. de 0,019 mm. Com outro mediu o comprimento natural de uma mola, tendo as mensuraes acusado mdia Exerccios II - 3
de 6,4 cm e d.p. de 0,03 cm. Qual dos dois aparelhos relativamente mais preciso? 15) Uma pesquisa sobre consumo de gasolina deu os seguintes valores para a quilometragem percorrida por trs marcas de carro (de mesma classe), em cinco testes com um tanque de 40 l: Carro A Carro B Carro C 400 403 399 397 401 389 401 390 403 389 378 387 403 395 401
Qual a medida mais adequada para comparar o desempenho dos carros? 16) O que acontece com a mediana, a mdia e o desvio padro de uma srie de dados quando: a) Cada observao multiplicada por 2; b) Soma-se 10 a cada observao; c) Subtrai-se a mdia geral x de cada observao; d) De cada observao subtrai-se x e divide-se pelo desvio padro. 17) A tabela abaixo mostra o tempo gasto por empregados numa determinada operao em uma fbrica: Tempo (min) 10 15 15 20 20 25 25 30 30 40 desses funcionrios? (tempo de 150 funcionrios) 18) Em testes de resistncia trao aplicados a um tipo de ao, obteve-se um coeficiente de variao de 8%. O escore padronizado obtido para uma resistncia de 28 kg/mm2 foi de -0,4. a) Qual a resistncia mdia? b) Qual o desvio padro? c) O que significa o resultado negativo do escore padronizado? Exerccios II - 4 Freqncia 5 57 42 28 18
a) Esboce o histograma correspondente; b) Calcule a mdia, o desvio padro; c) O presidente decide separar os funcionrios mais rpidos (com tempo inferior a um desvio padro abaixo da mdia) para receberem promoo. Qual a porcentagem
19)
O histograma abaixo descreve o tempo (em min) gasto por funcionrios de uma fbrica em uma determinada operao:
ni
50
30 20 15 10
10
15
20
25
35
a) Construa a distribuio para o histograma; b) Calcule a mdia e o desvio padro; c) O presidente decide demitir os funcionrios mais lentos (com tempo superior a meio desvio padro acima da mdia). Qual a porcentagem desses funcionrios?
Exerccios II - 5
Aqui, o interesse reside em analisar o comportamento conjunto de duas variveis e de um modo geral, podemos representar tais variveis utilizando uma tabela de dupla entrada, ou seja, uma Distribuio Conjunta das freqncias das variveis.
Assim, para duas variveis X= xi, com i = 1, 2, ...k e Y= yj com j = 1, 2, ... l, temos:
Y X 1 2 M i M k Total
1 n 11 n 21 M ni 1 M nk 1 n 1
2 n 12 n 22 M ni 2 M nk 2 n 2
L L L M L M L L
j n 1j n2j M ni j M nk j n j
L L L M L M L L
L n 1L n 2L M niL M nk L n L
Total n 1 n 2 M n i M nk n
Onde:
n =
i =1
n
j =1
ij
= ni = n j = no total de elementos.
i =1 j =1
f ij =
nij n
, fi =
ni n
e f j =
nj n
Estatstica - 21
Uma outra freqncia que pode ser construda aquela para a qual se mantm fixa uma linha. Para a i-sima linha fixa, temos ento:
fj i = nij ni
fi j =
nij nj
Yj Xi Economia
85 55 140
35 25 60
120 80 200
Administrao Total
Uma tabela (dentre outras possveis) poderia ser escrita a partir da Tabela A:
Yj Xi Economia
60% 40%
Administrao Total
100% coluna.
associabilidade existente entre as variveis, isto , queremos conhecer o grau de dependncia entre elas, de modo que possamos prever melhor o resultado de uma delas, quando conhecemos a realizao da outra.
Ex.: A partir de uma renda familiar podemos estimar a classe social de uma
Usando uma distribuio conjunta, como a fornecida pela Tabela A, verificamos que fica relativamente difcil tirar alguma concluso, devido diferena entre os totais marginais. Por outro lado, usando a Tabela B, podemos observar que independentemente do sexo, 60% das pessoas preferem economia e 40%, administrao (observe na coluna de total). No havendo dependncia entre as variveis, esperaramos estas mesmas propores para cada sexo. De fato, vemos que as propores do sexo masculino ( 61% e 39% ) e do feminino ( 58% e 42% ) so prximas das marginais ( 60% e 40% ). Esses resultados parecem indicar no haver dependncia entre as duas variveis. X e Y so portanto variveis independentes.
X Y Engenharia
Masculino Feminino
Total
( Tabela C ) Distribuio conjunta das propores em relao aos totais de cada linha.
nij Nesse caso, temos fj i = n i
C. Sociais Total
Existem algumas medidas que quantificam a dependncia entre variveis nominais. Uma delas o chamado coeficiente de contingncia, C, devido a Pearson. Tal coeficiente varia entre 0 e 1, e a proximidade de 0 indica total independncia.
Ex.: O clculo de C pode ser entendido por meio do seguinte exemplo, onde
queremos verificar se a criao de determinado tipo de cooperativa est associada com algum fator regional. A tabela a seguir, sintetiza os dados coletados (Dados observados, oij). Estatstica - 23
Estado Consumidor So Paulo Paran Rio G.Sul Total 214 (33%) 51 (17%) 111 (18%) 376 (24%)
Tipo de Cooperativa Produtor 237 (37%) 102 (34%) 304 (51%) 643 (42%) Escola 78 (12%) 126 (42%) 139 (23%) 343 (22%) Outros 119 (18%) 22 ( 7%) 48 ( 8%) 189 (12%) Total 648 (100%) 301 (100%) 602 (100%) 1551 (100%)
nij f j/i = ni .
Tal tabela mostra a existncia de uma certa dependncia entre as variveis. Caso houvesse independncia, esperaramos que em cada estado tivssemos 24% de cooperativas de consumidores, 42% de produtores, 22% de escolas e 12% de outros. Uma nova tabela, tabela E, poderia ser agora construda, onde teramos todos os valores esperados (eij) caso as variveis fossem independentes. ela dada a seguir:
Estado Consumidor So Paulo Paran Rio G.Sul Total 156 (24%) 72 (24%) 144 (24%) 376 (24%)
Tipo de Cooperativa Produtor 272 (42%) 127 (42%) 254 (42%) 643 (42%) Escola 142 (22%) 66 (22%) 132 (22%) 343 (22%) Outros 78 (12%) 36 (12%) 72 (12%) 189 (12%) Total 648 (100%) 301 (100%) 602 (100%) 1551 (100%)
relao
Comparando as Tabelas D e E, podemos verificar as discrepncias existentes entre os valores observados (oij) e os esperados (eij). Na prxima tabela, (F), evidenciamos essa discrepncia :
Estatstica - 24
Estado Consumido r
observados e esperados. -35 -25 50 -64 60 7 41 -14 -24 ( nij = oij eij )
58 -21 -33
fcil ver que em relao aos valores esperados (eij), o desvio em Escola - Paran (60) maior do que o desvio em Escola - So Paulo (-64).Uma maneira de observar melhor esses desvios relativos a eij considerar a seguinte medida:
(o e )
ij ij
eij
( 64 ) 2
142
= 28,84 e
( 60) 2
66
= 54 ,54
Estatstica - 25
Estado Consumido r
observados e esperados.
4,50 4,92 9,84 28,84 54,54 0,37 21,55 5,44 8,00
o e n = ij ij ij eij
Uma medida de afastamento global pode ser dada pela soma de todos os valores da tabela G. Essa medida possui distribuio de 2 (qui-quadrado) e, no nosso exemplo temos:
(o e ) = e
ij ij i j ij
Quanto maior for o valor de 2, maior ser o grau de associao existente entre as duas variveis. Pearson props o chamado coeficiente de contingncia C definido por
C=
2 2 +n
C =
C t 1 t
Onde t = mnimo entre o nmero de colunas e o nmero de linhas da tabela. Assim, para o nosso exemplo, temos:
C= 173,24 = 0,32 e 173,24 + 1551
C =
0,32 2 3
= 0,40
Estatstica - 26
Um procedimento til para se verificar a associao entre variveis quantitativas o grfico de disperso, que nada mais do que a representao dos pares de valores (nuvem de pontos) em um sistema cartesiano. Admitamos um grfico de disperso como os dados a seguir, onde, atravs de uma transformao conveniente a origem foi colocada no centro da nuvem de pontos:
(A)
(B)
(C)
Em ( A ) os dados possuem uma certa associao linear direta (ou positiva). Observando-os, notamos que a grande maioria dos pontos est situada no primeiro e terceiro quadrantes, onde as coordenadas tm o mesmo sinal e portanto o produto ser sempre positivo. Se somarmos o produto das coordenadas de todos os pontos, o resultado ser um nmero positivo. Em ( B ), usando o mesmo procedimento, o resultado ser negativo. Em ( C ), o resultado ser nulo.
Obs.: A soma dos produtos das coordenadas depende, e muito, do nmero de
pontos e torna-se difcil comparar essa medida para dois conjuntos diferentes de pontos. Isto atenuado usando-se a mdia da soma dos produtos das coordenadas.
Ex.: Suponha que o nosso desejo seja o de quantificar a associabilidade entre duas
variveis relacionadas a cinco agentes de uma seguradora. Assim, temos: X Anos de experincia do agente. Y Nmero de clientes do agente. A tabela e o grfico de disperso seguintes mostram os dados obtidos:
Estatstica - 27
Agente A B C D E Total
X 2 4 5 6 8 25
Y 48 56 64 60 72 300
O primeiro problema que devemos resolver a mudana da origem do sistema para o centro da nuvem pontos. O ponto mais conveniente aquele formado pelas duas mdias ( x , y ) . A transformao dos eixos x em x x e y em y y resolve esse problema.
Observando esses valores centrados, verificamos que ainda existe um problema quanto escala. A variabilidade em Y muito maior do que em X, e o produto das coordenadas ficar muito mais afetado pelos resultados de Y do que de X. Para corrigir isso, podemos reduzir as duas variveis a uma mesma escala. Isso obtido dividindo-se os desvios pelos respectivos desvios padres. Observe isso na figura a seguir:
y y
zy =
3 2 1 1 2 3
12 8 4 -3 -2 -1
y y sy
-4 -8
xx
-3
-2
-1
-1 -2 -3
3
zx =
xx sx
-12
Estatstica - 28
Agente A B C D E Total
x
2 4 5 6 8 25
y
48 56 64 60 72 300
xx
yy
-12 -4 4 0 12 0
xx = zx sx
-1.5 -0.5 0 0.5 1.5 0
y y = zy sy
zx . z y
2,25 0,25 0 0 2,25 4,75
-3 -1 0 1 3 0
x =5
Sx = 2
y = 60
Sy = 8
Para completar a definio da medida descrita no incio desse tpico, basta calcular a mdia dos produtos das coordenadas reduzidas, isto a correlao linear entre X e Y, dada por:
r = Correlao ( X , Y ) =
4,75 = 0,95 = 95 % 5
Portanto, para este exemplo, o grau de associabilidade est quantificado em 95%. Da discusso feita at aqui, podemos definir o coeficiente de correlao entre duas variveis X e Y, dados n pares ordenados ( x1 , y1 ) , ( x2 , y2 ) L( xn , yn ) como sendo:
r = Corr ( X , Y ) = 1 n 1 n xi x yi z z = n i =1 xi y i n i =1 s x s y y
ou seja, a mdia dos produtos dos valores reduzidos da varivel. Costuma-se usar outras frmulas para r:
r= 1 ( x i x )( y i y ) Covarincia ( X , Y ) , ou ainda = n sx s y sx s y
r=
( x
xy
i 2 i
nx 2 )( yi2 ny 2 )
nx y
Estatstica - 29
Exerccios III
01)
No estudo de uma certa comunidade verificou-se que: I. A proporo de indivduos solteiros de 0,4;
II. A proporo de indivduos que recebem at 10 salrios mnimos de 0,2; III. A proporo de indivduos que recebem at 20 salrios mnimos de 0,7; IV. A proporo de indivduos casados entre os que recebem mais de 20 salrios mnimos de 0,7; V. A proporo de indivduos que recebem at 10 salrios mnimos entre os solteiros de 0,3. a) Construa a distribuio conjunta das variveis estado civil e faixa salarial e as respectivas distribuies marginais; b) Voc diria que existe relao entre as duas variveis consideradas?
02)
Uma amostra de 200 habitantes de uma cidade foi colhida para analisar a atitude frente a um certo projeto governamental. O resultado foi o seguinte:
Local de Residncia Opinio A favor Contra Total Urbano 30 60 90 Suburbano 35 25 60 Rural 35 15 50 Total 100 100 200
a) Calcule as propores em relao ao total das colunas b) Voc diria que a opinio independe do local de residncia? c) Encontre uma medida de dependncia entre as variaes 03) Numa amostra de 5 operrios de uma dada empresa, foram observadas duas variveis; sendo X os anos de experincia num dado cargo e Y o tempo, em minutos, gasto na execuo de uma certa tarefa relacionada com esse cargo. x = 16 y = 22 x.y = 53 x2 = 62 y2 = 130
X Y
1 7
2 8
4 3
4 2
5 2
Exerccios III - 1
Usando um critrio estatstico, voc diria que a varivel X pode ser usada para explicar a variao de Y? Justifique. 04) Muitas vezes, a determinao da capacidade de produo instalada para certo tipo de indstria em certas regies um processo difcil e custoso. Como alternativa, pode-se estimar a capacidade de produo atravs da escolha de uma outra varivel de medida mais fcil e que esteja linearmente relacionada com ela. Suponha que foram observados os valores para as variveis: capacidade de produo instalada, potncia instalada e rea construda. Com base num critrio estatstico, qual das variveis voc escolheria para estimar a capacidade de produo instalada?
X capacidade de produo instalada (ton) Y potncia instalada (1.000 kW) Z rea construda (100 m) x = 80; x.y = 361; y = 38; x.z = 848; z = 100; y.z = 411.
4 1 7
5 1
4 2
5 3
8 3
9 10 11 12 12 5 5 6 6 6
7 10 10 11
9 12 10 11 14 z2 = 1048;
x2 = 736;
y2 = 182;
Exerccios III - 2
Obs.: Devido ao clculo de probabilidade envolver operaes entre conjuntos, o anexo I, ao final desse captulo, descreve sucintamente a Teoria Axiomtica da lgebra de Boole aplicada a conjuntos.
Dado um espao amostral E com n (E) elementos e um evento A de E com n(A) elementos, a probabilidade do evento A o nmero P(A) tal que: P( A) =
n( A ) n( E )
Na prtica:
Probabilidades - 1
Obs.: A feqncia relativa fi = ni /n comumente associada probabilidade. Essa associao nos leva a diversas distribuies de probabilidade. Atualmente, principalmente devido a Kolmogorov, um grande matemtico russo, o clculo de probabilidades constitui uma Teoria Matemtica com suas definies, axiomas, teoremas e demonstraes. As regras bsicas que constituem essa teoria so vistas a seguir.
Consideremos um espao amostral E com A e B eventos de E, com os seguintes axiomas: A1 : 0 P(A) 1 A2 : P (E) = 1 A3: Para qualquer A1, A2, ... Ai , Exclusivos Ai A j = i j , temos que
k k P U Ai = P ( Ai ) i =1 i =1
Alguns teoremas dessa teoria so: T1: P ( A B ) = P ( A) + P ( B ) P ( A B ) T2: P ( A ) = 1 P( A) T3: Se A B ento P ( A) P( B )
T4 : P ( A B C ) = P ( A) + P ( B ) + P ( C ) P ( A C ) P ( A B ) P( B C ) + P( A B C )
Obs.: Demonstre os teoremas T1 a T4. . Obs.: Uma breve reviso de Anlise Combinatria est descrita no anexo II. Este conhecimento muito til na determinao do nmero de elementos de um evento qualquer.
P ( A| B ) =
n( A B ) n( A B ) n ( E ) P ( A B ) = = n( B ) n( B ) n( E ) P( B)
P ( A B) = P ( B) P ( A | B) ,
de larga utilizao.
Dois eventos A e B so denominados independentes se a ocorrncia de um deles no interfere na ocorrncia do outro. Neste caso:
P ( A B) = P ( B) P ( A | B) = P ( A) P ( B | A) = P ( A) P ( B)
Obs.: freqente, aqui, adotarmos P(A B) = P(AB)
mutuamente independentes se: P(E1 E2 E3 ... En) = P(E1) . P(E2) . P(E3) ... P(En)
Probabilidades - 3
Ex.: A fundao de um alto edifcio pode ceder devido a falhas do tipo Bearingou do tipo Settlement. Seja B e S os respectivos modos de falha. Se P(B) = 0.1%, P(S) = 0.8% e
P( S B ) = P( B S ) = P( S ) P( B | S )
= P( S ) 1 P( B | S ) = 0.008 [1 01 .] = 0.0072 = 0.72%
Em um grande nmero de aplicaes, teremos que adotar a hiptese de independncia de dois eventos A e B, e depois empregar essa suposio para calcular P(AB) como igual a P(A) . P(B). Geralmente, condies fsicas sob as quais o experimento seja realizado tornaro possvel decidir se tal suposio ser justificada ou aproximadamente justificada.
Ex.: Consideremos um grande lote de peas, digamos 10.000. Admitamos que 10% dessas
peas sejam defeituosas e 90% perfeitas. Duas peas so extradas. Qual a probabilidade de que ambas sejam perfeitas?
Se admitirmos que a primeira pea seja reposta, antes que a segunda seja escolhida, ento os eventos A e B podem ser considerados independentes e, portanto, P(A B) = P(A) . P(B) = (0.9) (0.9) = 0.81.
Probabilidades - 4
Na prtica, contudo, a segunda pea escolhida sem a reposio da primeira pea; neste caso, P(A B) = P(A) . P(B | A) = (0.9) . que aproximadamente igual 0.81.
8999 9999
Assim, muito embora A e B no sejam independentes no segundo caso, a hiptese de independncia (que simplifica consideravelmente os clculos) acarreta apenas um erro desprezvel. Se existissem somente poucas peas no lote, a hiptese de independncia poderia acarretar um erro grande.
2.2.1 - Confiabilidade
A teoria da confiabilidade estuda sistemas e seus componentes, como, por exemplo, sistemas mecnicos ou eletrnicos (um automvel ou um computador). O objetivo desta teoria estudar relaes entre o funcionamento dos componentes e do sistema. A figura a seguir ilustra um sistema composto de dois componentes ligados em srie.
cd
O sistema funciona se os componentes 1 e 2 funcionam simultaneamente. Se um dos componentes no funciona, o sistema tambm no funciona. Supondo que os componentes funcionem independentemente, e se pi a probabilidade do componente i (i=1,2) funcionar, ento a probabilidade do sistema funcionar p1p2.
Chamando: E : o sistema funciona Ai : o componente i funciona, i = 1,2 ento, P(E) = P(A1 A2) = P(A1) P(A2) = p1 p2 Cada pi chamada a confiabilidade do componente i e P(E) = h (p1, p2) = p1 p2 Probabilidades - 5
chamada a confiabilidade do sistema. Se os componentes 1 e 2 estiverem ligados em paralelo, como na figura a seguir, ento o sistema funciona se pelo menos um dos dois componentes funciona. Ou seja,
c d
P (E) = P (A1 A2) = P (A1) + P (A2) - P (A1 A2) e a confiabilidade do sistema h (p1, p2) = p1 + p2 - p1p2
Ex.: Suponhamos que para o circuito da figura a seguir, a probabilidade de que cada rel
esteja fechado seja p, e que todos os rels funcionem independentemente. Qual ser a probabilidade de que o circuito permita a passagem de corrente entre A e B?
1
z
2
z
Empregando a mesma definio dos circuitos anteriores: P(E) = P(A1 A2) + P(A5) + P(A3 A4) - P(A1 A2 A5) - P(A1 A2 A3 A4) - P(A5 A3 A4) + P(A1 A2 A3 A4 A5) = = p2 + p + p2 -p3 - p4 - p3 + p5 p + 2p2 - 2p3 - p4 + p5
Uma bastante comum, mas errnea, resoluo de um problema, pode ser vista a seguir.
Ex.: Admita-se que dentre seis parafusos,.dois sejam menores do que um comprimento
especificado. Se dois dos parafusos forem escolhidos ao acaso, qual ser a probabilidade p de que os dois parafusos mais curtos sejam retirados? Adote que, Ai : o i-simo parafuso curto (i = 1,2) Probabilidades - 6
Naturalmente, o importante que, muito embora a resposta esteja numericamente correta, a identificao de 1/5 com P(A2) incorreta; 1/5 representa P(A2 | A1). Para calcular P(A2) corretamente, escrevemos P(A2) = = =
P ( A2 A1 ) + P ( A2 A1 )
P ( A2 | A1 ) P ( A1 ) + P ( A2 | A1 ) P ( A1 )
1 2 2 4 1 + = 5 6 5 6 3
Uma das relaes mais importantes envolvendo probabilidades condicionais dada pelo teorema de Bayes que expressa uma probabilidade condicional em termos de outras probabilidades condicionais. Se E1, E2, ... En so eventos mutuamente excludentes (Ei Ej = para todo i j)
n de um espao amostral Exaustivo E, U Ei = E , ento cada Ei denominado de partio de i=1
E. Se A um evento arbitrrio de E com p(A) > 0, ento a probabilidade de ocorrncia de uma das parties Ek, dado que ocorreu o evento A, pode ser expressa por:
P( E k | A ) = P ( E k A) P ( E K A) = n P( A ) P ( A Ei )
i=1
Probabilidades - 7
P( E k | A) =
P(E k ) P( A| E K )
P(E ) P( A| E )
i =1 i i
, e i = 1, 2, ....n
Sendo que P( A| E K ) =
P( A Ei ) P( A E K ) e P( A| Ei ) = P( E k ) P(E i )
Ex.: Uma companhia produz circuitos integrados em trs fbricas, I, II e III. A fbrica I
produz 30% dos circuitos, enquanto II e III produzem 45% e 25% respectivamente. As probabilidades de que um circuito integrado produzido por estas fbricas no funcione so 0.01, 0.02 e 0.04, respectivamente. Escolhido um circuito da produo com defeito conjunta das trs fbricas, qual a probabilidade de ele ter sido fabricado em I?
Fbrica
Produo
d (defeituoso)
P(F).P(d|F)
I II III
Assim:
P( I ) P( d | I )
P( I |d ) =
P( F ) P( d |F )
F =I
III
Probabilidades - 8
Exerccios IV
1 - Do-se as seguintes probabilidades para A e B: P(A) = 1/2, P(B) = 1/4,P(A | B) = 1/3. a) Utilizando as leis de probabilidade, calcular P( A ), P( AB ), P( A B ).
b) Usar diagrama para calcular P( AB ) e P( A B ) . 2 - Se A, B e C so eventos arbitrrios, exprima em notao de conjuntos os seguintes eventos: a) ocorrem apenas 2 eventos; b) ocorrem no mais de 2 eventos; c) ocorrem A e B mas no C. d) ocorre ao menos um e) no ocorre nenhum; f) ocorre apenas um. 3 - Numa amostra de 40 indivduos, 10 acusam presso alta. Estime a probabilidade de outro indivduo escolhido ao acaso, no mesmo grupo do qual foi extrada a amostra, tambm ter presso elevada. 4 - Jogam-se dois dados. Qual a probabilidade de o produto dos nmeros das faces superiores estar entre 12 e 15 inclusive? 5 - Uma moeda viciada de tal forma que a probabilidade de ocorrer cara duas vezes a de ocorrer coroa. Jogada trs vezes a moeda, qual a probabilidade de aparecerem exatamente duas coroas? 6 - Admitindo que a probabilidade de uma criana ser menino (H) seja 0,51, determinar a probabilidade de uma famlia de seis filhos ter: a) ao menos um H; b) ao menos uma M. 7 - Escolhido ao acaso um ponto no disco unitrio, determinar a probabilidade de o ponto estar no setor [0, /6]. 8 - A experincia indica que 15% dos que reservam mesa em um restaurante nunca aparecem. Se o restaurante tm 60 mesas e aceita 62 reservas, qual a probabilidade de poder acomodar todos os que comparecerem?
Exerccios IV - 1
9 - Um sistema tem dois componentes que operam independentemente. Suponhamos que as probabilidades de falha dos componentes 1 e 2 sejam 0,1 e 0,2, respectivamente. Determinar a probabilidade de o sistema funcionar nos dois casos seguintes: a) os componentes so ligados em srie (isto , ambos devem funcionar para que o sistema funcione); b) os componentes so ligados em paralelo (basta um funcionar para que o sistema funcione) 10 - Aps seleo preliminar, uma lista de jurados consiste em 10 homens e sete mulheres. Escolhidos dentre esses os cinco membros de um jri, a escolha recai somente sobre homens. O processo sugere discriminao contra as mulheres? Responda calculando a probabilidade de no haver nenhuma mulher no jri. 11 - Qual o nmero mnimo de jogadas de uma moeda necessrio para assegurar uma probabilidade superior a 0,74 de obter ao menos uma cara ? 12 - De acordo com certa tbua de mortalidade, a probabilidade de Jos estar vivo daqui a 20 anos 0,6, e a mesma probabilidade para Joo 0,9. Determinar: a) P (ambos estarem vivos daqui a 20 anos) b) P (nenhum estar vivo daqui a 20 anos) c) P (um estar vivo e outro estar morto daqui a 20 anos) 13 - Uma tbua de mortalidade acusa as seguintes taxas de mortalidade qx (isto , probabilidade de um indivduo de idade x morrer antes de atingir a idade x + 1): x q 30 31 32 33 34 35
a) Dado um indivduo de 30 anos, qual a probabilidade de ele atingir a idade de 31 anos? b) Para o mesmo indivduo, qual a probabilidade de morrer antes de completar 35 anos? 14 - Determinar a probabilidade de n pessoas (n 365) fazerem aniversrio em datas diferentes. 15 - As probabilidades de um estudante passar em lgebra (A), em Literatura (L) e ambas (AL) so 0,75, 0,84 e 0,63 respectivamente. Qual a probabilidade de passar em lgebra, sabendo-se que passou em Literatura?
Exerccios IV - 2
16 - A caixa I tem duas bolas brancas e duas pretas; a caixa II tem duas bolas brancas e uma preta; a caixa III tem uma bola branca e trs pretas. a) Tira-se uma bola de cada caixa. Determinar a probabilidade de serem todas brancas. b) Escolhe-se uma caixa ao acaso e tira-se uma bola. Qual a probabilidade de ser branca ? c) Em (b), calcular a probabilidade de ter sido escolhida a caixa I, sabendo-se que a bola extrada branca. 17 - Suponha um teste para cncer em que 95% dos que tm o mal reagem positivamente, enquanto que 3% dos que no tm o mal reagem positivamente. Suponhamos ainda que 2% dos internos de um hospital tenham cncer. Qual a probabilidade de um doente escolhido ao acaso, e que reaja positivamente ao teste, ter de fato o mal? 18 - Duas sacolas tm, cada uma, m moedas de R$ 5,00 e n moedas R$ 2,00. Extrai-se uma moeda de cada sacola. a) Calcular a probabilidade de ambas serem de R$ 5,00. b) Mostrar que essa probabilidade maior do que a de extrair duas moedas de R$ 5,00 de uma nica sacola com todas as moedas. 19 - Quando surgiu a LOTO, estabeleceu-se que o valor a ser cobrado por carto apostado seria proporcional ao nmero de quinas presentes no carto. Um carto com seis dezenas
6 7 tem = 6 quinas. Um com sete dezenas tem = 21 quinas. Como o nmero de 5 5 dezenas permitido varia de 5 a 10, temos os seguintes resultados: No de dezenas 5 No de quinas 1 6 6 7 21 8 56 9 126 10 252
Assim, um carto com cinco dezenas custava Cr$ 1,00, enquanto um com 10 dezenas custava Cr$ 252,00. Com estes preos, tornava-se muito caro apostar em vrias dezenas. O prmio acumulou vrias semanas! A dificuldade com o sistema adotado que ele considera apenas o prmio da quina, quando, na realidade, existem prmios tambm para as quadras e ternos. Considerando-se estes outros prmios, as relaes entre os preos dos cartes so outras. Seu clculo, entretanto, bem mais complicado. Em um volante com 100 dezenas, 00, 01, 02 ... 98, 99, o apostador pode marcar de 5 a 10 dezenas, concorrendo ao sorteio de uma quina, cinco quadras e 10 ternos. No menor jogo, cinco dezenas, ele paga (em fevereiro de 1986) Cr$ 1,20 e, pelo maior jogo, Cr$ 43,00.
Exerccios IV - 3
Qual a probabilidade de acertar a quina com um carto de cinco dezenas? de 10 dezenas? 20 - Com relao ao problema anterior, se estamos interessados apenas no prmio pago ao acertador da quina, o que mais vantajoso: um carto com 10 dezenas ou 35 cartes com cinco dezenas cada? 21 - Uma determinada pea manufaturada por trs fbricas, I, II e III. Sabe-se que I produz o dobro que II, II e III produziram o mesmo nmero de peas. 2% das peas produzidas por I e II so defeituosas; em III tem-se 4% de defeituosas. Todas as peas produzidas so colocadas em um depsito e depois uma pea extrada ao acaso. Qual a probabilidade de que esta pea seja defeituosa? 22 - Um sistema automtico de alarme contra incndio utiliza trs clulas sensveis ao calor que agem independentemente uma da outra. Cada clula entra em funcionamento com probabilidade 0,8 quando a temperatura atingir 60 C. Se pelo menos uma das clulas entrar em funcionamento o alarme soa. Calcular a probabilidade do alarme soar quando a temperatura atingir 60 C. 23 - Uma montagem eletromecnica formada por dois subsistemas A e B. De procedimentos de ensaios anteriores, as seguintes probabilidades se admitem conhecidas:
P(A falhe) = 0.20 P(A e B falhem) = 0.15 P(B falhe sozinho) = 0.25
Calcule a probabilidade: P(A falhe | B falhe). 24 - Um certo tipo de motor eltrico falha, com probabilidade de 10% devido aos fatores: emperramento de mancais, queima de enrolamentos, desgaste das escovas. Suponha que o emperramento seja duas vezes mais provvel do que a queima, e a queima, quatro vezes mais provvel do que o desgaste. Qual a probabilidade de que a falha se d por desgaste das escovas? (Obs.: a probabilidade de que haja falha devido aos trs fatores pode ser desprezada e os fatores so independentes) 25 - Uma companhia produz circuitos integrados em trs fbricas, I, II e III. A fbrica I produz 40% dos circuitos, a fbrica II 15% e a fbrica III 45%. As probabilidades de que um circuito integrado produzido por estas fbricas no funcionem so: 0.01, 0,04 e 0.03, respectivamente. Escolhido um circuito da produo conjunta das trs fbricas, qual a Exerccios IV - 4
26 - Um sistema de proteo atua devido a falhas em duas subestaes A e B, que agem conjuntamente. As probabilidades de falha nessas duas subestaes so P(A) = 0.002 e
Exerccios IV - 5
Varivel Aleatria (va) uma funo que associa nmeros reais aos pontos de um espao amostral. Ou seja, os resultados do experimento aleatrio so associados numericamente. Geralmente usamos letras maisculas (X, Y, Z...) para designar as variveis aleatrias, e minsculas (x, y, z...) para indicar particulares valores dessas variveis. O comportamento de uma varivel aleatria descrito por sua distribuio de probabilidade.
Ex.: No teste de dois componentes eletrnicos, podemos ter o seguinte espao amostral. E = { PP, PN, NP, NN } sendo P resultado positivo e N negativo.
Seja X o nmero de resultados positivos do teste. X uma varivel aleatria. Temos ento:
Pontos de E X
PP 2
PN 1
NP 1
NN 0
X P(X)
2 1/4
1 1/2
0 1/4
As variveis aleatrias podem ser discretas, contnuas ou mistas. No caso discreto a distribuio de probabilidade pode ser caracterizada por uma funo de probabilidade, que indica diretamente as probabilidades associadas a cada valor. No caso contnuo temos a funo densidade de probabilidade (fdp).
f (x ) =1
i=1 i
f ( x ) dx = 1
c) P (X = xi) = f (xi)
P (a < X b) =
f ( x ) dx
( b > a)
Ex.: No teste de partida de vlvulas eletrnicas a probabilidade de que haja um resultado positivo P (+) = 3/4 e um resultado negativo P (-) = (1/4). Os testes prosseguem at que acontea o primeiro resultado positivo. Temos ento o seguinte espao amostral: E = { +, - +, - - +, - - - +, ...} Definindo a varivel aleatria X como: X : nmero de testes do experimento. X = 1, 2, 3, ... temos a seguinte distribuio de probabilidade.
X P (X)
1
3 4
3 ...
3 16
3 ... 48
P(X) foi calculado usando a seguinte funo de probabilidade (aceitando que uma vlvula no influencie na outra):
P( X = x n ) = f ( x n ) = (1 / 4)
n1
( 3 / 4)
com n = 1, 2, 3, ...
As propriedades a) e c) so imediatas, b) pode ser vista assim: n 1 1 3 3 3 3 3 1 =1 f ( xi ) = + + +... = 1 + + +... . 1 4 16 48 4 4 16 4 i =1 1 4 Obs.: Estamos empregando o resultado de que a srie geomtrica 1 + r + r2 + ... converge para 1/(1-r) sempre que | r | < 1.
Probabilidades - 10
Ex.: Seja X a durao da vida (em horas) de um certo tipo de lmpada. Admitindo que X seja uma varivel aleatria contnua, suponha que a fdp f de X seja dada por f(x) = a/x3, 1.500 x 2.500 = 0 , para quaisquer outros valores. (Isto , est se atribuindo probabilidade zero aos eventos { x < 1500} e {x > 2500}).
2.500
1.500
( a x ) dx = 1.
3
Em captulo posterior estudaremos melhor muitas variveis aleatrias importantes, tanto discretas como contnuas.
servindo como alternativa para a caracterizao da distribuio de probabilidade de qualquer tipo de varivel aleatria.
F ( x) =
e no caso contnuo,
P( x )
i xi
xi x
F ( x ) = f ( x ) dx ,
x
com
f ( x) =
d F( x) . dx
0 F( x ) 1 F ( ) = 0 F ( + ) = 1
b) c)
F ( b) F ( a ) = P( a < x b)
( b > a)
Ex.: Suponhamos que a varivel aleatria X assuma os trs valores 0,1 e 2, com probabilidade
1/2 1/3 0 1 2 3 x
Observe que P(X = xi) igual ao salto que a funo F(x) d em xi; por exemplo, P(X=1)= 1/6 = F(1) - F (1-). De um modo geral P(X = xi) = F(xi) - F(xi-)
Obs.: F ( x i ) = lim F ( y )
y x
Ex.: Suponhamos que X seja uma varivel aleatria contnua com fdp
f(x) = 2x, 0 < x < 1 = 0, para quaisquer outros valores. Portanto, F(x) dada por:
Probabilidades - 12
F(x) = 0 se x 0 =
2sds = x 2
se 0 < x 1
= 1 se x > 1
1 f(x)=2x
F(x)
Ex.: Suponha que uma varivel aleatria contnua tenha F(x) dado por:
F(x) = 0
,x0
= 1 - e-x , x > 0
d F( x) = e-x dx
x0
f(x ) 0
x
funcionamento, uma v.a.contnua com fdp f (x) para x 0. No entanto, podem surgir situaes
Probabilidades - 13
nas quais exista uma probabilidade no nula p de que o equipamento no funcione no momento x = 0. Nesse caso, podemos modificar o nosso modelo e atribuir P (X = 0) = p e P(X > 0) = 1 - p. Deste modo, p descreve a distribuio de X no ponto 0 (v.a. discreta), enquanto f (x) descreve a distribuio para valores de x > 0 (v.a. contnua). Tal distribuio um exemplo de distribuio mista. Observe o grfico:
P(X = 0) = p f(x)
f ( x )dx = 1 p
Um par ordenado de valores aleatrios define uma v.a. bidimensional. Uma distribuio de probabilidade bidimensional pode ser discreta, sendo caracterizada por uma funo probabilidade bidimensional tal que
i j P x i , y j = 1;
P xi , y j 0
ou contnua, sendo caracterizada por uma funo densidade de probabilidade bidimensional tal que
f ( x, y ) dx dy = 1
f ( x, y ) 0
No caso discreto, definem-se as distribuies marginais de X e Y (os totais em cada linha e coluna - ver cap1) respectivamente, por:
( ) P( Y = y ) = P( x , y ) ,
j i i j
P( X = xi ) = j P xi , y j ,
g( x ) = f ( x, y ) dy
Probabilidades - 14
h( y ) = f ( x, y ) dx
Duas v.a. discretas X e Y so independentes se, para todos os pares (xi, yj) P(xi, yj) = P(X = xi) . P(Y = yj)
Analogamente, no caso contnuo, X e Y so independentes se, para todos os pares (x, y), f (x, y) = g(x) . h (y)
Ex.: Duas linhas de produo fabricam um certo tipo de pea. Suponha que a capacidade (em
qualquer dia) seja de 5 peas na linha I e 3 peas na linha II. Admita que o nmero de peas realmente produzidas em qualquer linha seja uma varivel aleatria, e que (x, y) represente a varivel aleatria bidimensional que fornece o nmero de peas produzidas pela linha I e a linha II, respectivamente. A tabela a seguir fornece a distribuio de probabilidade conjunta de (x, y) . Cada casa representa p = (xi , yi) = P (X =xi ,Y = yi) Assim, p (2,3) = P (X = 2; Y = 3) = 0.04, etc...
Se B for definido, por exemplo, como: B : Mais peas so produzidas pela linha I do que pela linha II ento encontraremos que: P (B) = 0.01 + 0.03 + 0.05 + 0.07 + 0.09 + 0.04 + 0.05 + 0.06 + 0.08 + 0.05 + 0.05 + 0.06 + 0.06 + 0.05 = 0.75
0 1 2 3
Total 0.03 0.08 0.16 0.21 0.24 0.28 1.00 Suponhamos que se deseje calcular a probabilidae condicionada P(X = 2 | Y = 2). Temos ento:
Probabilidades - 15
P(X = 2 | Y = 2) =
( )
) = P(X = x | Y = y ) ,
i j
P (yj) > 0
encomendadas a ele durante os meses de janeiro e fevereiro. Sejam X e Y, respectivamente, o nmero de lmpadas encomendadas durante esses dois meses. Admitiremos que (X , Y) seja uma v.a contnua bidimensional, com a seguinte fdp conjunta f (x, y) = c =0 5000 x 10.000 , 4.000 y 9.000
9000 R 4000
5000
10000
9.000
4.000
10.000
5.000
P (B) = 1 c 5.000
y 5.000
17 25
f (x, y) = x 2 + =0
xy 3
0x1
0y2
f ( x, y ) dx dy = 1
(Verifique!)
Se B = {X + Y 1} P(B) = 1 - P( B )
Portanto, P(B) = 1 0
y 2
1
1 x 0
2 xy 65 x + dy dx = 3 72
y=1-x
2 xy 2 2 = + + 2 x dy x x 0 3 3
2 1
x
0
xy y 1 dx = + 3 6 3
f ( x, y ) x 2 + xy 3 6 x 2 + 2 xy = = h( y ) 1 3+ y 6 2+ y
f ( x , y ) x 2 + xy 3 3x + y = = 2 6x + 2 g( x ) 2 2x + x 3
0 x 1, 0 y 2
0 x 1, 0 y 2
Probabilidades - 17
1 0
6 x 2 + 2 xy 2+ y dx = =1 2+ y 2+ y
3x + y dy = 1 6x + 2
2 0
y2 ( ) 2 x + y 2 xy dy = 2 xy + xy 2 0 2
1
1 0
=1
0x1
2( x + y 2xy ) dx = 2( x
1 0
/ 2 + xy x 2 y )
1 0
=1
0y1
Obs.: Dizemos que a v.a. contnua bidimensional uniformemente distribuda sobre uma
regio R do plano euclideano quando f (x, y) = cte =0 para (x, y) R para qualquer outra regio
Em virtude da condio
f ( x, y ) dxdy = 1
a definio acima acarreta que a constante ser igual a 1/rea (R). Estamos supondo que R seja uma regio com rea finita, no nula.
Probabilidades - 18
Ex.: Suponhamos que a v.a. (x, y) seja uniformemente distribuda sobre a regio R indicada
na figura a seguir. Portanto, f ( x, y) =
y (1,1) y=x R y = x2 x
1 , area ( R)
( x, y ) R
Assim rea ( R ) = 0 ( x x 2 ) dx = 1 6
1
, ( x, y) R , ( x, y) R
g( x ) = f ( x, y ) dy = x 2 6 dy = 6( x x 2 ) ,
x
0 x 1,
h( y ) = f ( x, y ) dy = y 6 dx = 6( y y ) ,
y
0 y 1
g(x)
h(y)
x = 1/2
(1,0)
y = 1/4
Ex.: Suponhamos que uma mquina seja utilizada para determinada tarefa durante a manh e
Probabilidades - 19
para uma tarefa diferente durante a tarde. Representemos por X e Y, respectivamente o nmero de vezes que a mquina pra por defeito de manh e tarde. A tabela a seguir d a distribuio de probabilidade conjunta de (x, y).
Um clculo simples mostra que, para todas as casas temos p(xi, yj) = p(xi) . p(yj). Portanto, X e Y so v.a.
0 1 2 p(xi)
independentes.
Ex.: Sejam X e Y a durao da vida de dois dispositivos eletrnicos. Suponha que a fdp
conjunta seja dada por: f (x, y) = e-(x+y) x0 y0
Desde que podemos fatorar f (x, y) = e-x . e -y, a independncia entre X e Y fica estabelecida.
Ex.: Seja agora f (x, y) = 8 x y , 0 x y 1 uma fdp. O domnio indicado pela regio da
figura seguinte.
Muito embora f j seja escrita na forma fatorada, X e Y no so independentes j que o campo de definio dependente.
Probabilidades - 20
Exerccios V
1 - Uma moeda viciada de tal forma que P(K) = 2P(C). Jogando-a trs vezes, determinar a distribuio de probabilidade do nmero de caras, X. Determinar a funo cumulativa e calcular: a)
P(1 X 3) b)
P( X > 2)
3 - No exerccio anterior, determinar uma aproximao para: p( X 8 6) . 4 - Em cada caso, determinar se os valores dados podem ser considerados como integrantes de uma v.a. X que tome apenas os valores 1, 2, 3, 4: a) f(1) = 0,23 b) f(1) = 1/7 c) f(1) = 0,15 d) f(1) = 0,26 f(2) = 0,28 f(2) = 2/7 f(2) = 0,2 f(2) = 0,49 f(3) = 0,39 f(3) = 1/14 f(3) = 0,38 f(3) = 0,08 f(4) = 0,18 f(4) = 3/7 f(4) = 0,27 f(4) = 0,33
5 - Determinar a distribuio de probabilidade e a distribuio acumulada do nmero de discos de rock, quando se escolhem aleatoriamente quatro discos de uma coleo com cinco discos de rock, trs de msicas popular e dois clssicos. 6 - O dimetro X de um cabo eltrico supe-se ser uma v.a. contnua X, com fdp f ( x ) = 6 x (1 x ) , 0 x 1. a) Verifique se f(x) realmente uma fdp e esboce o seu grfico; b) Obtenha uma expresso para F(x); c) Calcule P( X 1 2 | 1 3 < X < 2 3) 7 - A porcentagem de lcool em certo composto pode ser considerada uma v.a X., onde X,
0 < X < 1, tem a seguinte funo de probabilidade:
f ( x ) = 20 x 3 (1 x ) 0 < X < 1
a) Estabelea a expresso de F(x); b) Calcule p( x 2 3) ; c) Suponha que o preo de venda desse composto dependa do contedo de lcool. Especificamente, se 1/3 < x < 2/3, o composto se vende por C1 dlares/galo; caso contrrio, ele se vende por C2 dlares/galo. Se o custo for C3 dlares/galo, calcule a distribuio de probabilidade do lucro lquido por galo.
Exerccios V - 1
As distribuies de probabilidade so modelos tericos onde as probabilidades dos valores assumidos pela v.a. podem ser interpretadas como freqncias relativas (fi ) em um nmero sempre crescente de provas, ou seja, como limites de freqncias relativas. Podemos, pois, definir, para as distribuies de probabilidade, as mesmas medidas de tendncia central e de disperso utilizadas nas distribuies de freqncias do Captulo 1.
Guardando essa semelhana podemos definir a mdia de uma v.a. X como: E(X) = xi f ( xi )
(caso discreto)
E(X) a Esperana Matemtica, tambm chamada de Valor Esperado, Expectncia ou ainda Mdia Populacional (). Repare que E(X) uma mdia ponderada dos xi, em que os pesos so as probabilidades associadas.
E(X) =
x f ( x ) dx
(caso contnuo)
Sendo (X, Y) uma v.a. bidimensional, faamos Z = H (X, Y). - Se (X, Y) for discreta e se p (xi, yj) = p (X = xi, Y = yj), E(Z) =
j=1 i j i j
i, j = 1, 2, 3, ... teremos:
H( x , y ) p( x , y )
i=1
H ( x, y ) f ( x, y ) dx dy
Probabilidades - 21
So propriedades de E(X) (as verificaes so aqui dadas apenas para o caso contnuo. Verifique tais propriedades tambm para o caso discreto):
i)
Se X uma v.a. com X = c, onde c uma constante, ento E(X) = E(c) = c. Pois: E( X ) = c f ( x ) dx = c f ( x ) dx = c
Observe o significado de X = c
f(x)
x=c
E ( cX ) = cx f ( x ) dx = c x f ( x ) dx = cE( X )
Obs.: Se multiplicarmos todos os termos de uma v.a. X por c, o seu valor mdio fica tambm multiplicado por c.
iii) Seja (X, Y) uma v.a. bidimensional. Seja Z = H1 (x, y) e W = H2 (x, y). Ento E (Z + W) = E(Z) + E (W) Realmente:
E ( Z + W ) = [ H1 ( x, y ) + H 2 ( x, y )] f ( x, y ) dxdy = E( Z ) + E (W )
iv) Se X e Y so duas v.a. quaisquer. Ento E(X + Y) = E(X) + E(Y). E isso decorre imediatamente de iii. v) Sejam n v.a. X1, X2, ... Xn.. Ento: Probabilidades - 22
E ( X 1 + X 2 + L+ X n ) = E ( X 1 ) + E ( X 2 ) + L+ E ( X n )
De fato:
E ( XY ) =
Ex.: Seja X uma v.a. que assume os seguintes valores X = {15, 10, 5 - 5} e tenha a seguinte distribuio de probabilidade: X f ( x)
Ex.: Suponhamos que a procura D, por semana, de um certo produto seja uma v.a. com uma certa distribuio de probabilidade, digamos P( D = n ) = p( n ) , n = 0, 1, 2, ... . Admitamos que Probabilidades - 23
o custo para o vendedor seja C1 dlares por pea, enquanto ele vende cada pea por C2 dlares. Qualquer pea que no tenha sido vendida at o fim de semana deve ser estocada ao custo de C3 dlares por pea. Se o vendedor decidir produzir N peas no incio da semana, qual ser seu lucro esperado por semana? Para que valor de N, o lucro esperado se torna mximo? Se L for o lucro semanal, temos
D>N DN
L = N ( C2 C1 )
= ( C2 + C3 )D N ( C1 + C3 )
D>N DN
p( n) + ( C
+ C3 ) np( n ) N ( C1 + C3 ) p( n )
n= 0 n= 0
N N = N ( C2 C1 ) + ( C2 + C3 ) np( n ) N p( n ) n= 0 n= 0
E ( L ) = N ( C2 C1 ) + ( C2 + C3 ) p( n ) ( n N )
n= 0
n = 1, 2, 3, 4, 5.
Ento:
E ( L) = N (C2 C1 ) +
N 5 N >5
Probabilidades - 24
Logo,
E ( L) = 6N + 2 [ N ( N + 1) 2 N 2 ] = 6N + 2(15 5N )
ou ainda
E( L) = 7N N 2 = 30 4 N N 5 N >5
N 5 N >5
Portanto, o mximo ocorre para N = 3,5. Para N = 3 ou 4, teremos E ( L ) = 16 , que o mximo atingvel, posto que N inteiro.
E (L)
3 .5
Seja X uma v.a.. Definimos a varincia de X denotada por Var(X), S2 ou 2, da seguinte maneira:
Comprove!
Obs.: Var ( X ) = E[( X E( X ))2 ] um caso especial da seguinte noo mais geral. O k-simo
Probabilidades - 25
nebulosidade. Uma escala de 11 categorias empregada: 0, 1, 2, ... 10, onde 0 representa o cu perfeitamente claro, enquanto os outros valores representam as diferentes condies intermedirias. Suponha que uma determinada estao meteorolgica faa tal classificao em um determinado dia e hora. Seja X a v.a. que pode tomar um dos 11 valores acima. Admita-se que a distribuio de probabilidade de X seja:
Portanto,
E ( X ) = 1.( 015 . ) + 2 .( 015 . )+L+10 .( 0.05) = 5.0
f ( x ) = 1 + x 1 x 0 = 1 x 0 x 1
f(x)
-1
1 0 1 1 0 1 1 0
Var( X ) = 1 6
i)
Pois: Var ( X + c ) = E [( X + c ) E ( X + c )]
} = E{[( X + c) E( X ) c] }
2
= E[( X E( X ))2 ] = Var( X ) Obs.: Esta propriedade intuitivamente evidente, porque somar uma constante a um resultado X no altera sua variabilidade, que aquilo que a varincia mede. Apenas desloca os valores de X para a direita ou esquerda, dependendo do sinal de c. ii) Var(cX) = c2 Var(X) Pois: Var ( cX ) = E [( cX )2 ] [ E ( cX )] = c 2 E ( X 2 ) c 2 [ E ( X )]
2 2
= c 2 E( X )2 [ E ( X )]
} = c Var( X )
2
Pois:
E( X ) .
Obs.: Se interpretarmos Var(X) como o momento de inrcia e E(X) como o centro de uma
unidade de massa, ento a propriedade acima uma formulao do teorema dos eixos Probabilidades - 27
paralelos, em Mecnica. O momento de inrcia em relao a um ponto arbitrrio igual ao momento de inrcia em relao ao centro de gravidade, mais o quadrado da distncia desse ponto arbitrrio ao centro de gravidade.
E ( X ) se torna mnimo se = E ( X ) . Isto decorre imediatamente da
propriedade acima. Portanto, o momento de inrcia (de uma unidade de massa distribuda sobre uma reta), em relao a um eixo que passe por um ponto arbitrrio, torna-se mnimo se esse ponto escolhido for o centro de gravidade.
Existe uma bem conhecida desigualdade, devida ao matemtico russo Tchebichev, que nos fornece meios de compreender precisamente como a varincia mede a variabilidade em relao ao valor esperado de uma v.a.. ela:
2 P( X ) 2
ou, com = k onde:
P( X k ) 1 k2
P( X 2 ) 0.25 ou
P( X < 2 ) 0.75
Em palavras, a probabilidade de X diferir de sua mdia em mais de dois desvios padres inferior ou, no mximo, igual a 0.25; equivalentemente, a probabilidade de X estar compreendido no intervalo de dois desvios padres a contar de sua mdia, superior ou, no mnimo, igual a 0.75. Tal fato tanto mais notvel quanto se considerarmos que nem sequer especificamos a distribuio de probabilidade de X.
Probabilidades - 28
Exerccios VI
1 - Se uma pessoa recebe R$ 5,00 se aparecerem somente caras ou somente coroas na jogada de trs moedas, e paga R$ 2,00 em caso contrrio, qual seu ganho esperado? 2 - Determinar o nmero esperado de qumicos em um comit de trs elementos escolhidos entre quatro qumicos e trs bilogos. 3 - X uma v.a. com a seguinte distribuio de probabilidade: x f ( x) 0 1/4 1 1/8 2 1/4 3 1/8 4 1/4
4 - Mostre que a varivel padronizada tem mdia 0 e varincia 1. 5 - O tempo T, em minutos, necessrio para um operrio de uma indstria processar certa pea uma v.a. com a seguinte distribuio de probabilidade: T 2 3 4 5 6 7 P 0.1 0.1 0.3 0.2 0.2 0.1 Para cada pea processada, o operrio ganha um fixo de U$ 2.0 mas se ele processa uma pea em menos de 6 minutos, ganha U$ 0.5 por minuto poupado (por exemplo, se ele processa a pea em quatro minutos, recebe a quantia adicional de U$ 1.0). Qual a mdia e a varincia da quantia ganha por pea? 6 - Suponha que um mecanismo eletrnico tenha um tempo de vida X (em unidades de 1000 horas) que tenha uma funo de probabilidade dada por: f ( x ) = e x , x > 0 . Suponha que o custo de fabricao de um item seja U$ 200 e o preo de venda seja U$ 500. O fabricante garante total devoluo se x 0,8. Qual o lucro esperado por item? 7 - O tempo de vida (em horas) de um mancal uma varivel aleatria, com funo de probabilidade dada por:
1 e t 800 f ( t ) = 800 0 ,t0 ,t<0
A vida mdia do mancal de 800 horas. Qual a probabilidade de que o seu tempo de vida seja maior do que a mdia?
Exerccios VI - 1
A partir do estudo de elementos da teoria de conjuntos os seguintes conceitos, entre outros, podem ser facilmente entendidos: Sendo A e B dois conjuntos quaisquer, temos: i) A B (l-se A est includo em B ou A um subconjunto de B) se e somente se para todo a A ento a B.
B A
ii) A = B se e somente se A B e B A.
iii) A B (l-se A unio B) o conjunto formado pelos elementos que pertencem a A, a B ou a ambos, isto : A B = { x : x A ou x B}
iv) A B (l-se A interseo B) o conjunto formado pelos elementos que pertencem a A e a B, isto : Anexo 1 - 1
A B = { x : x A e x B}
vi) CAB (l-se complemento de B com relao a A) o conjunto formado por aqueles elementos de A que no pertencem a B, isto : CAB = { x A : x B}
lgebra Booleana Um modelo matemtico da teoria axiomtica da lgebra de Boole pode ser encontrado dentro da teoria de conjuntos, usando os conceitos acima definidos. Assim, temos: Sendo, X, Y, Z, ... subconjuntos de um conjunto universal A, isto , X, Y, Z... P (A)
Anexo 1 - 2
definidas as operaes binrias: a: P(A) P(A) P(A) (X, Y) X+Y=XY X.Y=XY me: P(A) P(A) P(A) (X, Y)
X +Y = Y + X
X . ( Y + Z ) = ( XY ) + ( XZ )
X . Y = YX
X + ( YZ ) = ( X + Y )( X + Z ) X .1 = X
X +0= X
X + X =1
X.X = 0
5)
1 0
e associando 1 a A e 0 a
temos uma importante ferramenta para operao de conjuntos. Alguns teoremas desse modelo so: a)
X + X = X; X.X = X
b) Se X + Y = 1 ento Y = X X .Y = 0 c) d) e) f)
X=X
X . 0 = 0 ; X +1 = 1
X ( X + Y ) = X ; X + ( XY ) = X X + ( Y + Z ) = ( X + Y ) + Z ; X( YZ ) = ( XY ) Z
g) ( X + Y ) = X . Y ; X . Y = X + Y h)
(Leis de De Morgan)
0 =1; 1 = 0
Obs.: Demonstre os teoremas acima. Perceba que essa teoria tambm se aplica a
[( A B) ( A B)] [( A B) ( A B)]
Uma possvel soluo:
( A . B + A . B) . ( A . B + A . B )
( A . B + A . B) + ( A . B + A . B )
A ( B + B) + A ( B + B )
A .1 + A .1 = A + A = 1
fazendo I , U + , X X
usando (g)
evidenciando A e A usando o axioma (4) e (3)
usando (h)
1 = 0 (vazio)
Anexo 1 - 4
O clculo efetivo da probabilidade de um evento depende freqentemente do uso dos resultados da Anlise Combinatria. Esta seo , pois, um sumrio dos principais resultados dessa rea de matemtica elementar. A lista de exerccios, referente a essa parte, ao final, sintetiza esse sumrio.
Os problemas de Anlise Combinatria so, basicamente, problemas de contagem. A abordagem destes problemas baseada num fato, de fcil comprovao, denominado Princpio Fundamental da Contagem ou, simplesmente, Regra do Produto, que enunciaremos e exemplificaremos a seguir. Um acontecimento composto por k estgios sucessivos e independentes, com, respectivamente, n1, n2, n3 ..., nk possibilidades cada. O nmero total de maneiras distintas de ocorrer este acontecimento n1, n2, n3 ..., nk.
Ex.: Um engenheiro, ao se inscrever em um programa de mestrado deve escolher o curso e a faculdade que deseja cursar. Sabe-se que existem cinco cursos possveis: Mecnica, Eltrica, Telecomunicaes, Civil e Robtica. Cada curso pode ser feito em trs faculdades possveis: no Brasil, no Japo, nos EUA. Qual o nmero total de opes que o engenheiro pode fazer? n = 5 . 3 = 15 opes Tcnicas de Contagem
Seja A = { a; b; c; d; ... j } um conjunto formado por 10 elementos distintos, e consideremos os agrupamentos abc, abd e acb. Os agrupamentos abc e abd so considerados sempre distintos, pois diferem pela natureza de um elemento. Anexo 2 - 1
Os agrupamentos abc e acb, podem ser considerados distintos ou no. Se por exemplo, os elementos do conjunto A forem pontos, A = { A1, A2, ... A10 }, e ligando estes pontos desejarmos obter retas, ento os agrupamentos A1 A2 e A2 A1 so iguais, pois representam a mesma reta. isso um tpico caso de combinao simples. Se por outro lado, os elementos do conjunto A forem algarismos, A = {0, 1, ..., 9}, e com estes algarismos desejarmos obter nmeros, ento os agrupamentos 12 e 21 so distintos, pois representam nmeros diferentes. isso um tpico caso de arranjo simples. Apresentaremos, a seguir, o estudo sucinto dos trs tipos de agrupamentos comumente utilizados em problemas de contagem, que so: Arranjos, Permutaes (so um tipo particular de arranjo) e combinaes. Arranjos simples Seja A um conjunto com n elementos e k um nmero natural, com k n. Chamase arranjo simples k a k, dos n elementos de A, a cada subconjunto de k elementos de A. Obs.: Note que, de acordo com a definio, os arranjos so agrupamentos que diferem entre s, tanto pela natureza como tambm pela ordem de seus elementos. De acordo com a definio dada, na formao de todos os arranjos simples k a k dos n elementos de A, temos: n possibilidades na escolha do 1o elemento; n - 1 possibilidades na escolha do 2o elemento, pois um elemento j foi utilizado; n - 2 possibilidades na escolha do 3o elemento, pois dois j foram utilizados; M n - (k + 1) possibilidades na escolha do ko elemento.
De acordo com o Princpio Fundamental da contagem, o nmero total de arranjos simples k a k dos n elementos de A n(n - 1) (n - 2) ... (n - k + 1). Representando esse nmero por A n, k, temos: A n, k = n (n - 1) (n - 2) ... (n - k + 1), ou ainda A n, k =
n! ( n - k )!
Anexo 2 - 2
Seja A um conjunto com n elementos. Os arranjos simples n a n de n elementos de A so chamados permutaes simples de n elementos, representado por Pn. Assim: Pn = An, n = n!
Ex.: P6 = 6! = 720 Combinaes simples Seja A um conjunto com n elementos e k um nmero natural, com k n. Chamase combinao simples k a k, dos n elementos de A, a cada subconjunto de k elementos de A. Cn, k o smbolo utilizado para representar o nmero total de combinaes de n, k a k. Permutando os k elementos de uma combinao k a k, obtemos Pk arranjos distintos. Permutando os k elementos das Cn,k combinaes, obtemos Pk. Cn,k arranjos simples, que so exatamente todos os arranjos simples de n elementos k a k. Assim sendo, Cn,k . Pk = An,k e portanto: Cn,k =
An,k Pk
ou Cn,k =
n! n Cn,k = k! ( n - k!) k
Permutaes com repetio Sejam a elementos iguais a , b elementos iguais a , g elementos iguais a ..., l elementos iguais a , num total de a+b +g+ ... + l = n elementos O nmero total de permutaes distintas que podemos obter com estes n elementos :
P* = Pna ,b , g ,...l = n! a !b! g !... l !
Anexo 2 - 3
Permutaes circulares
P = ( n - 1)!
n + k 1 * Cn = C = ,K n + K - 1, K k
Anexo 2 - 4
Exerccios VII
01) H 6 estradas entre A e B e 4 entre B e C. De quantas maneiras pode-se ir de A a C, passando por B. 02) Com relao ao problema anterior, de quantas maneiras pode-se ir e voltar de A a C, sem usar a mesma estrada mais de uma vez? 03) Dados os conjuntos A = { 1, 2, 3, 4 } e B = { 1, 2, 3, 5, 6, 7 }, calcular o nmero de funes injetoras de A em B. Obs.: Uma funo injetora se para xyf(x)f(y) com f:AB. 04) Sendo A = { 1, 2, 3, 4 } e B = { 7, 8, 9, 10 }, calcular o nmero de funes bijetoras de A em B. Obs.: Uma funo bijetora se xyf(x)f(y) e im(A)=B 05) Quantos nmeros de algarismos distintos e compreendidos entre 100 e 1000, podem ser obtidos utilizando os algarismos 1, 2, 3, 5, 6? 06) Quatro livros diferentes de Matemtica, seis de Fsica e dois de Qumica devem ser arrumados em uma prateleira. Quantas arrumaes diferentes podem ser feitas, se: a) os livros de cada matria devem ficar juntos? b) apenas os de matemtica devem ficar juntos? 07) 08) Quantas comisses de 3 elementos podemos formar com um grupo de 8 pessoas? Um fabricante de doces dispe de embalagens com capacidade de 4 doces cada uma . Sabendo-se que ele fabrica 10 tipos diferentes de doces, pergunta-se: Quantos tipos de embalagens com 4 doces diferentes ele poder oferecer? 09) Vamos supor que uma placa de motocicleta contenha duas letras distintas do alfabeto completo, seguidas por trs dgitos. Quantas placas diferentes podem ser impressas? 10) Quantos so os anagramas da palavra AEROPORTO? (Anagramas so palavras com ou sem sentido a partir de uma palavra primitiva) 11) De quantas maneiras, uma oficina pode pintar 5 automveis iguais, recebendo cada um, tinta de uma nica cor, se a oficina dispe apenas 3 cores e no quer mistur-las? 12) Resolver a equao: x . (x + 1) . A16, x - 1 = A16, x + 1
Exerccios VII - 1
13)
Quantos nmeros mpares, compreendidos entre 2000 e 7000, podemos formar com os algarismos 2, 3, 4, 6, 8 e 9, de modo que no figurem algarismos repetidos?
14)
Um trem de passageiros constitudo de uma locomotiva e 6 vages distintos, sendo um deles restaurante. Sabendo que a locomotiva deve ir frente e que o vago restaurante no pode ser colocado imediatamente aps a locomotiva, o nmero de modos diferentes de montar a composio :
15)
Com dez consoantes diferentes e com cinco vogais diferentes, quantas palavras (com sentido ou no) podem ser formadas, tendo cada palavra trs consoantes diferentes e duas vogais diferentes?
16)
Uma empresa tem 3 diretores e 5 gerentes. Quantas comisses de 5 pessoas podem ser formadas, contendo no mnimo 1 diretor?
17)
So dados 12 pontos em um plano, dos quais 5 e somente 5 esto alinhados. Quantos tringulos podem ser formados com vrtices em 3 dos 12 pontos?
18)
Uma urna contm 10 bolas brancas e 6 pretas. De quantos modos possvel tirar 7 bolas, das quais pelo menos 4 bolas sejam pretas?
19)
No sistema decimal, quantos nmeros de cinco algarismos (sem repetio) podemos escrever, de modo que os algarismos 0 (zero), 2 (dois) e 4 (quatro) apaream agrupados? Obs.: Considerar somente nmeros de cinco algarismos em que o primeiro algarismo diferente de zero.
20)
Calcular o nmero mximo de planos determinados por 8 pontos do espao dos quais 4 so coplanares.
21)
Existem n maneiras de distribuir 7 moedas de valores diferentes entre duas pessoas. Excluindo-se possibilidade de uma s receber todas as moedas, o valor de n ser?
22)
Com os algarismos 1, 2, 3, 4 e 5, e sem repetio, pode-se escrever x nmeros maiores que 2.500. Calcular x.
23)
Em um avio de oito lugares viajam oito pessoas, das quais quatro tm condies de operar como piloto ou co-piloto. De quantas maneiras diferentes estas oito pessoas podem se distribuir no avio?
24)
Quantos so, ao todo, os anagramas da palavra MATEMTICA que comeam com Exerccios VII - 2
vogal? (No levar em conta o acento). 25) 26) O nmero de solues inteiras e no negativas da equao x + y + z + w = 5 : Um feirante possui, em sua banca, mas, peras e laranjas em grande quantidade. Desejando atender melhor a sua clientela, o feirante resolveu empacotar todas as sua frutas, de modo que cada pacote contivesse exatamente 5 frutas. Quantos tipos de pacotes poder o feirante oferecer, no mximo, sua clientela? 27) Numa loteria so sorteados 6 objetos. Sabe-se que a urna contm exatamente 20 bilhetes. Uma pessoa retira da urna 4 bilhetes. Qual o nmero de possibilidades que essa pessoa tem de retirar, pelo menos 2 bilhetes premiados entre os quatro retirados. 28) O nmero de comisses diferentes, de 2 pessoas, que podemos formar com os n diretores de uma firma, k. Se, no entanto, ao formar estas comisses, tivermos de indicar uma das pessoas para presidente e a outra para suplente podemos forma k + 3 comisses diferentes. Ento, n vale: 29) Dado um polgono convexo P de n lados, calcular o nmero de polgonos convexos, cujos vrtices so vrtices de P. 30)
31)
Dentre os anagramas distintos que podemos formar com n letras, das quais somente duas so iguais, 120 apresentam estas duas letras iguais juntas. Ento, n vale:
32)
Uma prateleira tem 6 compartimentos separados. De quantas maneiras podemos colocar nos compartimentos 4 bolinhas indistinguveis? (Este tipo de problema surge na Fsica em relao estatstica de Bose-Einstein).
33)
Uma prateleira tem 6 compartimentos separados. De quantas maneiras podemos distribuir 11 bolinhas indistinguveis pelos compartimentos, de modo que nenhum deles fique vazio? (Este tipo de problema surge na Fsica em relao estatstica de Fermi-Dirac).
Exerccios VII - 3
Nesse captulo sero apresentadas vrias distribuies de probabilidade, desenvolvendo sua forma analtica a partir de certos conceitos bsicos sobre fenmenos reais. Tais distribuies tem extensivas aplicaes em engenharia, cincia bsica, etc. Sero elas subdivididas em discretas e contnuas.
f (x ) =1
i=1 i
iii) P ( X = x i ) = f ( x i )
Existem muitos problemas nos quais os experimentos consistem de n provas ou subexperimentos. Aqui o interesse apenas em uma prova individual onde haja duas possibilidades de resultado: sucesso (S) ou Falha (F).
Por convenincia, iremos definir uma v.a. X = 1 se o resultado de uma prova for S e X = 0 se o resultado for F. Assim temos o espao amostral E = { S , F} e:
F 0 q
Distribuies - 1
f(x)=p(x) q p
A distribuio acima, ou
P( X = 1) = p P( X = 0) = q
F(x) 1 q
Observe que nessas provas (provas de Bernoulli) as condies so idnticas nas n provas. Os resultados S e F so mutuamente excludentes com probabilidades constantes p e q (com p + q = 1). As provas so independentes umas das outras (o conhecimento do resultado de uma prova, S ou F, no influencia no resultado seguinte).
Distribuies - 2
probabilidade p de sucesso em cada prova. A v.a. X faz a seguinte associao ao espao amostral E:
X: Nmero de sucessos
A distribuio de X pode ser determinada como segue: x 0 1 2 3 P(x) P{FFF} = P(X = 0) = qqq = q3 P{FFS} + P{FSF} + P{SFF} = P(X = 1) = 3pq2 P{FSS} + P{SFS} + P{SSF} = P(X = 2) = 3p2q P{SSS} = P(X = 3) = p3
Uma forma de descrever P(x) para o exemplo anterior pode ser dada por (confira!):
3 P( X = x ) = p x q 3 x x x = 0, 1, 2, 3
Distribuies - 3
A v.a. X que representa o nmero de sucessos em n provas de Bernoulli tem uma distribuio denominada Binomial dada por:
n P( X = x ) = p x (1 p ) n x x = 0, 1, 2, L n x =0 para outros valores
f (x ) = 1
i= 0 i
De fato:
n p k (1 p ) nk = [ p + (1 p )] n =1n = 1 P( X = k ) = k =0 k =0 k
n n
Os parmetros dessa distribuio so n, n , e p, 0 p 1. Uma simples demonstrao da distribuio Binomial dada a seguir: Seja: P (X = x) = P {x sucessos em n provas} A probabilidade para um resultado particular onde ocorre S nas x primeiras provas e F nas n - x provas restantes
x nx P{123 SSSSK 1 FF K FF 4 24 3} = p q x n x
, (q = 1 p)
E( X ) = x .
Fazendo y = x - 1
E ( X ) = np
y=0
( n 1)! p y q n1 y y !( n 1 y )!
que resulta em
E(X) = np
Distribuies - 4
que resulta em
Obs.:Uma bem mais simples aproximao poderia ter sido considerar X como a
soma de n independentes variveis aleatrias de Bernoulli, cada uma com mdia p e varincia pq. Teramos assim:
X = X1 + X 2 + L + X n E ( X ) = E ( X 1 ) + E ( X 2 ) + L + E ( X n ) = p + p + L + p = np Var ( X ) = Var ( X 1 ) + Var ( X 2 ) + L + Var ( X n ) = pq + pq + L + pq = npq
eletrnico 0,2. Colocando-se trs componentes sob teste, qual a probabilidade de que pelo menos dois deles se queime? Adotando (Q) para o componente que se queime e (N) para o caso dele no se queimar, temos o seguinte espao amostral E: E = {QQQ, QQN, QNQ, NQQ, NNQ, NQN, QNN, NNN}
Associando p probabilidade do componente se queimar e empregando as suposies de independncia de um resultado em relao ao outro, temos as seguintes probabilidades associadas ao espao amostral E: { (0.2)3, (0.8).(0.2)2, (0.8) (0.2)2, (0.8).(0.2)2, (0.2)(0.8)2, (0.2)(0.8)2, (0.2) (0.8)2, (0.8)3 }
Nosso interesse no est dirigido para os resultados individuais de E. Ao contrrio, desejamos to somente conhecer quantos componentes com resultado Q sejam encontrados (no interessando a ordem em que tenham ocorrido). Isto , desejamos estudar a
Distribuies - 5
v.a X a qual atribui a cada resultado de E o nmero de componentes queimados. Consequentemente o conjunto dos valores possveis de X { 0, 1, 2, 3 }, com a seguinte distribuio de probabilidade: x 0 1 2 3 P(x) P{NNN} = P(X = 0) = q3 = (0.8)3 P{NNQ} + P{NQN} + P{QNN} = P(X = 1) = 3pq2 = 3(0.2)(0.8)2 P{QQN} + P{QNQ} + P{NQQ} = P(X = 2) = 3p2q = 3(0.2)2(0.8) P{QQQ} = P(X = 3) = p3 = (0.2)3
Observe que a soma de p(x) igual a 1 porque tal soma pode ser escrita como (0.8 + 0.2)3.
Para o nosso problema: Calcular a probabilidade de que pelo menos dois deles se queime, temos: P(X 2) = P(X=2) + P(X= 3) = 3p2q + p3 = 0.104 = 10,4%
Se n for pequeno, os termos individuais da distribuio binomial sero relativamente fceis de calcular. Contudo, se n for relativamente grande, os clculos se tornam bastante incmodos. Felizmente foram preparadas tabelas de probabilidades binomiais; existem vrias dessas tabelas. (Veja Tabela 1, em anexo).
tenha probabilidade 0.2 de funcionar mais do que 500 horas. Se ensaiarmos 20 vlvulas, qual a probabilidade de que delas, exatamente k, funcionem mais que 500 horas (k = 0, 1, 2, ... 20)? Seja X nmero de vlvulas que funcionem mais de 500 horas. p = 0.2 X = 0, 1, 2, ... 20 Admitindo a distribuio binomial
20 k 20 k P( X = k ) = ( 0.2) ( 0.8) k
Os valores podem ser obtidos por tabela para n = 20 e p = 0.20. Observe que a tabela fornece valores acumulados, assim, por exemplo P(X = 4) = F(4) - F(3) ou seja P (X = Distribuies - 6
0 1 2 3 4 5 6 7 8 9
18
Obs.:
Relembrando: ( x + y ) n = a 0 x n + a1 x n1 y + a2 x n2 y 2 + L+ a n1 x y n1 + a n y n n n n n i i = a i x y = x n i y i i= 0 i= 0 i
A distribuio geomtrica est tambm associada seqncia de uma prova de Bernoulli excetuando-se que o nmero de provas no fixada, e, na verdade, a v.a. de interesse X definida como o nmero de provas necessrias para obter o primeiro sucesso. A figura a seguir ilustra a associao entre o espao amostral e a v.a. X:
Distribuies - 7
1 2 3 4 5 M X = 1, 2, 3, ...
f ( x ) = 1 pois pq
x =1 x =1
x 1
1 = p q k = p =1 1 q k =0
= Var ( X ) = x pq
2 2 x =1
x 1
1 1 = p x 2 q x 1 p p x =1 2
q = 2 p
Ex.: Um certo experimento repetido at que um determinado resultado seja
obtido. As provas so independentes e o custo de executar um experimento de $ 25.000. Entretanto, se o resultado a alcanar (Sucesso) no for atingido, um custo de $ 5.000 necessrio para o setup da prxima prova. Busca-se determinar o custo esperado do projeto.
Distribuies - 8
X 1 2 3 ...
C (X) = $ 25.000 X + $ 5.000 (X - 1) = (30.000) X - 5.000 Assim: E [C(X)] = E [30.000 X] - E (5.000) = 30.000 E(X) - 5.000 = 30.000 .
1 - 5.000 p
Se a probabilidade de sucesso em uma simples prova de, digamos 0,25, ento E[C(X)] = $ 115.000.
Suponha agora que se tenha somente $ 500.000 para investir no experimento. Qual a probabilidade do custo ultrapassar essa quantia? Temos ento que:
P ( C( X ) > 500000) = P ( 30000 X 5000 > 500000) 505000 = P X > 30000 = P ( X > 16.833) = 1 P ( X 16 ) = 1 ( 0.25)( 0.75) x 1
x =1 16
16
A distribuio geomtrica decresce, isto , p (x) < p (x - 1) para x = 2, 3, .... Isto mostrado no seguinte grfico.
Distribuies - 9
P (x )
no tem memria, isto , P ( X > x + s | X > s) = P ( X > x) ou seja: Suponha-se que o evento S no tenha ocorrido durante as primeiras s repeties do experimento. Ento a probabilidade de que ele no ocorra durante as prximas x repeties ser a mesma probabilidade que no tivesse ocorrido durante as primeiras x repeties. Em outras palavras, a informao de nenhum S esquecida, no que interessa aos clculos subseqentes.
Distribuies - 10
Exerccios VIII
1 - Um estudo mostra que 70% dos pacientes que vo a uma clnica mdica devem esperar no mnimo 15 minutos para serem atendidos. Determinar as probabilidades de que, de oito pacientes, 0, 1, 2, 3, ..., 7, 8 tenham de sujeitar-se quela espera. Fazer um histograma dessa distribuio de probabilidade. 2 - Utilizando a tbua de probabilidades binomiais, determinar as seguintes probabilidades: a) 3 sucessos em 9 provas, com p = 0,4; b) 6 falhas em 15 provas, com p = 0,6; c) 5 ou mais sucessos em 8 provas, com p = 0,5; d) entre 7 e 12 (ambos inclusive) sucessos em 15 provas, com p= 0,7. 3 - Se h 0,2 de probabilidade de uma pessoa dar crdito a um rumor sobre a vida privada de certo poltico, qual a probabilidade de que a quinta pessoa a ouvir tal rumor seja a primeira a dar-lhe crdito? 4 - Segundo a teoria de Mendel, no enxerto de duas espcies de plantas com flores amarelas e brancas, 30% das plantas resultantes tm flor amarela. Em sete pares de plantas enxertadas, qual a probabilidade: a) de no resultar flor amarela; b) de haver quatro ou mais plantas com flor amarela. 5 - Se a probabilidade de nascimento de menino 0,52, qual a probabilidade de o terceiro filho de uma famlia ser o primeiro homem (H)? 6 - Em um grupo de 1500 asilados, 570 tm 75 anos ou mais. Em uma amostra aleatria de 11, qual a probabilidade: a) de quatro terem 75 anos ou mais; b) de trs ou menos estarem naquela faixa etria. 7 - Se a probabilidade de um eleitor, escolhido aleatoriamente, votar em uma eleio 0,75, qual a probabilidade de sete entre 10 eleitores comparecerem eleio 8 - Em 1500 famlias de trs filhos, quantas podemos esperar: a) com ao menos um menino (H); b) com exatamente duas meninas (M); c) com nenhuma menina. Exerccios VIII - 1
9 - Um depsito recebe trs lotes de pilhas para lanternas. Sabe-se que as percentagens de pilhas defeituosas no 1o, no 2o e no 3o lote so, respectivamente, 0,015, 0,02 e 0,04. Escolhida ao acaso uma pilha de cada lote, qual a probabilidade de: a) haver no mximo duas defeituosas; b) no haver nenhuma defeituosa. 10 - (Bhattacharyva & Johnson) Um laboratrio contratado para fornecer, a um distribuidor, lotes de vacina para gado. Ocasionalmente, algumas vacinas se revelam ineficazes. O distribuidor quer proteger-se contra o risco de receber um nmero indesejvel de vacinas ineficazes. Como no possvel testar todas as vacinas (j que o teste inutiliza a vacina), o distribuidor adota o seguinte processo de seleo: extrai de cada lote uma amostra aleatria de 10 ampolas, contendo um nmero X de vacinas estreis. se X = 0, o lote aceito. Se X 1, o lote rejeitado. Este processo designado plano de amostragem simples com tamanho de amostra n = 10 e nmero de aceitao c = 0. Admitamos que o tamanho do lote seja suficientemente grande para que a distribuio de X seja (aproximadamente) binomial, com n = 10 e p = frao desconhecida de vacinas estreis em cada lote. a) Se p = 0,2 qual a probabilidade de o lote ser aceito? b) Calcule a probabilidade P(A) de aceitar um lote, para p = 0,05, p = 0,1, p = 0,2 , p = 0,4. Grafe P(A) como funo de p, unindo os pontos do grfico por uma curva contnua (esta curva chamada curva caracterstica de operao (CCO) para o plano de amostragem).
Exerccios VIII - 2
A distribuio de Pascal tambm tem a sua base nas provas de Bernoulli. uma extenso da distribuio geomtrica. Nesse caso, a v.a X representa o nmero de repeties necessrias a fim de que um resultado bem sucedido possa ocorrer exatamente r vezes. evidente que se r = 1, X ter a distribuio geomtrica.
Se X = k ento o sucesso, de probabilidade p, ocorre na k-sima repetio e nas (k - 1) repeties anteriores tal sucesso ocorreu (r - 1) vezes. A probabilidade desse evento simplesmente
k 1 r 1 ( k 1) ( r 1) .p , p .q r 1
desde que o que acontece nas primeiras (k - 1) repeties independente daquilo que acontece na k-sima repetio. Portanto,
k 1 r k r f ( x ) = P( X = k ) = p .q , r 1
k = r , r + 1, ...
Suponha que tentativas de lanamento sejam feitas at que tenham ocorrido 3 lanamentos bem sucedidos. Qual a probabilidade de que exatamente 6 tentativas sejam necessrias? Temos aqui que: p = 0,8 e o espao amostral pode ser assim definido: E = {SSFFFS, SFSFFS, --------S, ...}
6 1 2 3 com p q representando a distribuio binomial antes do terceiro sucesso 3 1
Assim, temos: 5 5 P( X = 3) = ( 0.8) 2 ( 0.2)3 ( 0.8) = ( 0.8)3 ( 0.2)3 2 2 Se estivermos interessados em calcular a probabilidade de que menos de 6 tentativas sejam necessrias, temos:
Distribuies - 11
Pode-se provar que para a distribuio de Pascal, a mdia e a varincia so dadas por:
E( X ) = rq r e Var ( X ) = 2 p p
experimento for repetido at que quatro resultados bem sucedidos tenham ocorrido, qual ser o nmero esperado de repeties necessrias? Temos simplesmente que:
E( X ) =
4 =5 ( 0.8)
P (X = x )
Negativa.
Vamos examinar agora uma importante v.a discreta de maior nmero de dimenses, a qual pode ser considerada como uma generalizao da binomial. Considere um experimento E, seu espao amostral E, e a partio de E em k eventos mutuamente
Distribuies - 12
excludentes A1, A2,... Ak. (isto , quando E for realizado, um, e somente um dos eventos Ai ocorrer.). Considere agora n repeties de E . Seja pi = P(Ai) e suponha que pi permanea constante durante todas as repeties. Evidentemente, teremos:
p
i=1
=1
Definindo as v.a. X1, X2, ... Xk como: Xi nmero de vezes que Ai ocorre nas n repeties de E . i = 1, 2, ...k Os Xi no so v.a. independentes, porque
X
i =1
os valores de quaisquer (k - 1) dessas v.a. sejam conhecidos, o valor da outra ficar determinado. Chegamos ento ao seguinte resultado, a distribuio multinomial.
P ( X 1 = n1 , X 2 = n2 , L, X k = nk ) = n! n2 nk p1n1 p2 L pk n1 ! n2 !L nk !
onde ni = n
i=1
dois eventos sero denominados de sucesso (S) com probabilidade p e falha(F) com probabilidade q = 1 - p.
comprimento real X (polegadas) seja uma v.a. uniformemente distribuda sobre [10,12]. Suponha que se deseje investigar a ocorrncia de trs eventos:
A1 = { X < 10.5}, A2 = {10.5 X 118 . } e A3 = { X > 118 . } com probabilidades: p1 = P( A1 ) = 0.25 , p 2 = P( A2 ) = 0.65 e p3 = P( A3 ) = 01 .
Distribuies - 13
Se 10 dessas barras forem fabricadas, a probabilidade de termos 5 barras de comprimento dado por A1, e 2 dado por A3 obtida por:
P( X 1 = 5, X 2 = 3, X 3 = 2) = 10 ! ( 0.25)5 ( 0.65)3 ( 01 . )2 5 ! 3! 2 !
No estudo da distribuio binomial, vimos que ela se aplica quando a probabilidade de sucesso se mantm constante em todas as provas do experimento. A binomial corresponde, pois, ao esquema de extraes com reposio. A distribuio hipergeomtrica adequada quando consideramos extraes casuais feitas, sem reposio, de uma populao dividida segundo dois atributos. Aqui as probabilidades de sucesso e falha no se mantm constante.
examinados. O nmero de elementos com defeito r = 10. Escolhendo-se n = 5 peas sem reposio, a probabilidade de no se obter peas defeituosas , por raciocnio simples:
10 90 0 5 0.584 p= 100 5 A probabilidade de se obter 2 defeituosas : 10 90 2 3 0.007 p= 100 5 Generalizando: Considere uma populao de N elementos, r dos quais sejam sucessos e N - r sejam falha. Escolhendo ao acaso n elementos da populao (n N), sem reposio, e adotando X como o nmero de sucessos obtidos, temos a seguinte distribuio de probabilidade hipergeomtrica.
Distribuies - 14
P( X = k ) =
r k
N r n k N n
k = 0, 1, 2, L
que uma remessa seja aprovada, um inspetor escolhe 5 desses motores e os inspeciona. Se nenhum dos motores inspecionados for defeituoso, o lote aprovado. Se um ou mais forem verificados defeituosos, todos os motores da remessa so inspecionados. Suponha que existam, de fato, trs motores defeituosos no lote. Qual a probabilidade de que a inspeo 100% seja necessria? Se fizermos igual a X o nmero de motores defeituosos encontrados, a inspeo 100% ser necessria se X 1. Logo:
3 47 0 5 P( X 1) = 1 P( X = 0) = 1 0.28 50 5
Distribuies - 15
e k P( X = k ) = k!
son, com parmetro > 0.
X = 0, 1, 2, L
P( X = k ) =
k =0
e k = e e = 1 k! k =0
Uma interessante propriedade dessa distribuio que a sua mdia e varincia so iguais. Observe:
k e k e k E( X ) = = k! k =0 k =1 ( k 1)!
Fazendo s = k - 1 obtemos:
E( X ) =
s= 0
e s+1 e s = = s! s! s= 0
um lucro de C dlares por hora (C > 2 ) a uma firma. Contudo, esta mquina tende a falhar em momentos inesperados e imprevisveis. Suponha que o nmero de falhas durante qualquer perodo de durao t horas, seja uma v.a. com distribuio de Poisson com parmetro t. Se a mquina falhar X vezes durante as t horas o prejuzo sofrido (parada da mquina mais reparao) igual a (X2 + X) dlares. Assim, o lucro total P, durante qualquer perodo de t horas, igual a: P = Ct - (X2 + X), onde X a v.a que representa o nmero de falhas da mquina. Se desejarmos escolher o valor de t de tal maneira que o lucro esperado se torne Distribuies - 16
mximo, teremos: E(P) = E(Ct) - E(X2 + X) = Ct - E(X2) - E(X) Sabendo que E(X2) = t + t2 e E(X) = t, E(P) = Ct - 2t - t2 Para achar o valor de t para o qual E(P) se torna mximo, derivamos E(P) e fazemos a expresso resultante igual a zero. Assim, C - 2 - 2t = 0, o que fornece t = (C - 2) horas.
Existem essencialmente, duas razes pelas quais a distribuio de Poisson representa papel to importante em muitas aplicaes: Como aproximao da Distribuio Binomial e no estudo de eventos raros atravs do Processo de Poisson. Vejamos o primeiro caso: Aproximao da Distribuio Binomial
Seja X uma v.a. distribuda binomialmente com parmetro p (baseado em n repeties de um experimento). Isto , n P( X = k ) = p k (1 p ) nk k Admita-se que quando n , p 0 e np . Nessas condies possvel demonstrar uma importante considerao:
e k lim P( X = k ) = n k!
Ou seja, poderemos obter uma aproximao das probabilidades binomiais com a aproximao de Poisson, toda vez que n seja grande e p seja pequeno.
J verificamos que se X tiver uma distribuio binomial, E(X) = np, enquanto se X tiver uma distribuio de Poisson (com parmetro ), E(X) = . Nessa aproximao adotamos ento = np.
0,001. Determinar a probabilidade de que de 2.000 indivduos injetados, exatamente 3 tenham Distribuies - 17
reao negativa. Usando a distribuio binomial com n = 2.000 e p = 0.001 temos: 2000 3 1997 P( X = 3) = ( 0.001) ( 0.999) 3 O clculo desses nmeros d origem a considervel dificuldade. Pela aproximao de Poisson temos:
= np = ( 2000 )( 0.001) = 2
e 2 23 P( X = 3) = = 01804 . 3!
Para determinar a probabilidade de que mais de quatro tenham reao negativa temos:
P( X > 4) = 1 [ P( X = 4) + P( X = 3) + P( X = 2) + P( X = 1) + P( X = 0) ] e 2 2 4 e 2 2 3 e 2 2 e 2 2 0 = 1 + + + 3! 1! 0! 4! 16 8 4 = 1 e 2 + + + 2 + 1 = 0.055 24 6 2
Com o advento das modernas calculadoras, tais clculos se fazem com extrema rapidez. Contudo, existem tabelas de valores da distribuio de Poisson que facilitam em muito essas operaes. Em anexo, esto inseridas essas tabelas e, assim como para a distribuio binomial, so elas acumuladas, ou seja:
e k P( X k0 ) = k! k =0
k0
(Ver tabela 2)
Tal clculo ultrapassa em muito o mbito das tbuas binomiais usuais, em vista do elevado valor de n. O clculo direto impraticvel. Usando a aproximao de Poisson temos: = np = (200) (0.04) = 8
Distribuies - 18
P(X 5) = 0.1912, valor obtido da Tab. 2 na interseo da coluna 8 com o valor 5. Se desejarmos por exemplo P(X = 7) usando a tabela, temos:
P( X = 7 ) = F ( 7 ) F ( 6 ) = 0.4530 0.3134 = 01396 .
O Processo de Poisson
A distribuio de Poisson exerce por si mesma um papel extremamente importante porque ela representa um modelo probabilstico adequado para um grande nmero de fenmenos observveis. Suponhamos que determinados eventos estejam ocorrendo em certos intervalos de tempo e que as hipteses abaixo sejam vlidas: i) O nmero de ocorrncias de um evento em um intervalo de tempo independente do nmero de ocorrncias do evento em qualquer outro intervalo disjunto; ii) A probabilidade de duas ou mais ocorrncias simultneas (seqenciais) praticamente zero; iii) O nmero mdio de ocorrncias por unidade de tempo constante ao longo do tempo. Temos ento aqui um processo de Poisson. Uma apresentao mais formal de tal processo pode ser vista na Referncia 1.
quatro partculas radioativas por milissegundo. Qual a probabilidade de entrarem no contador seis partculas em determinado milissegundo? Utilizando a distribuio de Poisson com = 4, temos ento que:
e 4 46 P( X = 6) = = 01042 . 6!
(Verifique que as condies do processo foram satisfeitas.)
tem capacidade para 15 desses navios. Qual a probabilidade de que, em determinado dia, um Distribuies - 19
ou mais navios tanque tenham de ficar ao largo, aguardando vaga? Temos aqui que, para = 10:
P( X > 15) = 1 P( X 15) = 1 0.9513 = 0.0487
Ex.: Uma central telefnica recebe em mdia 300 chamadas por hora e pode
processar no mximo 10 ligaes por minuto. Estimar a probabilidade de a capacidade da mesa ser ultrapassada. Temos agora: = 300/60 = 5 chamadas/minuto em mdia
P( X > 10 ) = 1 P( X 10 ) = 1 0.986 = 0.014 = 1,4%
importante compreender que a distribuio de Poisson surgiu como uma conseqncia de algumas hipteses que fizemos. Isto significa que sempre que essas hipteses sejam vlidas (ou ao menos aproximadamente vlidas), a distribuio de Poisson pode ser empregada como um modelo adequado. Uma grande classe de fenmenos podem empregar esse modelo.
ocorrncias de um evento, durante um perodo de tempo fixado, mas tambm ao nmero de ocorrncias de um evento dentro das fronteiras de uma rea ou volume fixados.
que, na parte considerada, a densidade de estrelas seja constante. [Isto significa que em um volume V (unidades cbicas), podem ser encontradas, em mdia, V estrelas]. Seja XV o nmero de estrelas encontradas em uma parte da Via-Lctea que tenha o volume V. Se as hipteses do Processo de Poisson forem satisfeitas (com volume substituindo tempo), ento
en P( XV = n ) = com = V n!
As hipteses interpretadas neste contexto, afirmariam essencialmente que o nmero de estrelas que aparecem em partes no sobrepostas da Via-Lctea, representam v.a. independentes e que a probabilidade de mais do que uma estrela aparecer em uma parte bastante pequena do cu zero. Distribuies - 20
Exerccios IX
1 - Nos sinais de um transmissor ocorrem distores aleatrias a uma taxa mdia de 1 por minuto. Para mensagens de 3 minutos, a taxa mdia de ocorrncia de distoro de 3 por mensagem. Qual a probabilidade de o nmero de distores em uma mensagem de 3 minutos ser: a) 2; b) 1; c) 3 ou mais. 2 - Na fabricao de resistores de 50 ohms so considerados bons os que tm resistncia entre 45 e 55 ohms. Sabe-se que a probabilidade de um deles ser defeituoso 0,2%. Os resistores so vendidos em lotes de 100 com a garantia de serem todos bons. Qual a probabilidade de um lote violar esta garantia? 3 - Uma central telefnica recebe em mdia 300 chamadas por hora e pode processar no mximo 10 ligaes por minuto. Utilizando a distribuio de Poisson, estimar a probabilidade de a capacidade da mesa ser ultrapassada. 4 - A probabilidade de uma pessoa sofrer intoxicao alimentar na lanchonete de um parque de diverses 0,001. Com auxlio da aproximao de Poisson, determinar a probabilidade de que, em 1500 pessoas que passam o dia no parque, no mximo duas tenham intoxicao. 5 - Uma urna contm duas bolas brancas e seis pretas. extrai-se uma, anota-se a cor e devolve-se a bola urna. Determinar a probabilidade de aparecer bola branca exatamente trs vezes em oito extraes. 6 - Jogam-se dois dados muitas vezes. Determinar a probabilidade de a soma 7 aparecer pela primeira vez na stima jogada. 7 - Jogam-se dois dados muitas vezes. determinar a probabilidade de a soma 7 aparecer pela quarta vez na stima jogada.
Exerccios IX - 1
8 - Conhecem-se a seguintes probabilidades: 0,6, de uma declarao de imposto de renda ser preenchida corretamente; 0,2, de uma declarao conter somente erros que favorecem o contribuinte; 0,1, de uma declarao conter somente erros que favorecem o fisco; 0,1, de uma declarao conter ambos os tipos de erro. Calcular a probabilidade de que, em 10 declaraes selecionadas aleatoriamente, seis estejam corretas, duas contenham erros a favor do contribuinte, uma contenha erros a favor do fisco e uma contenha ambos os tipos de erro. 9 - Um agricultor planta seis sementes escolhidas aleatoriamente de uma caixa com cinco sementes de tulipa e quatro de crisntemo Qual a probabilidade de ele plantar duas sementes de crisntemo e quatro de tulipa?
Exerccios IX - 2
Uma distribuio contnua de probabilidade (ou funo densidade de probabilidade - fdp) tem, como sabemos, as seguintes propriedades: i) f ( x ) 0
ii)
f ( x) = 1
iii) P( a X b ) =
b a
f ( x )dx
(b > a )
f (x) =
f(x)
1
Observe que as propriedades das fdp so satisfeitas com a definio acima. Isto :
f ( x )dx =
dx =1
b
P( a X b) = a
dx ba =
Distribuies - 21
+ 1 xdx = x2 = 2( ) 2
x 2 dx + ( )2 = Var ( X ) = 12 2
dx x =
, x < , x , x
F(x) 1
Temos agora,
f ( x ) = e x =0
, x0 , outros valores
com R, ( > 0)
f (x )
Distribuies - 22
e x dx = e x
=1
+ 0 e x dx =
E( X ) = DP( X ) = 1
, x<0 , x0
F(x) 1
Ex.: Um componente eletrnico conhecido por ter sua vida til representada por
uma fdp exponencial com tempo mdio de falha E(X) de 105 horas (logo = 10-5). Suponha que desejamos determinar a frao de componentes que podero falhar antes da vida mdia ou valor esperado.
Distribuies - 23
Temos ento,
1 1 1 P T = 0 e x dx = e x = 1 e 1 0 = 0.63212
Esse resultado indica que 63,212% dos componentes iro falhar antes de 105 horas.
f (x )
63.212
36.788 1 E( X ) =
Ex.: Suponha que um fusvel tenha durao de vida X, a qual pode ser
considerada uma v.a. contnua com distribuio exponencial. Existem dois processos pelos quais o fusvel pode ser fabricado. O processo I apresenta uma durao de vida esperada de 100 horas (isto , = 100-1), enquanto o processo II apresenta uma durao de vida esperada de 150 horas ( = 150-1). Suponha que o processo II seja duas vezes mais custoso (por fusvel) que o processo I, que custa C dlares por fusvel. Admita-se, alm disso, que se um fusvel durar menos que 200 horas, uma multa de K dlares seja lanada? Obs.: (C > K) Vamos calcular o custo esperado para cada processo. Para o processo I, teremos C1 = custo (por fusvel) = C =C+K se X > 200 se X 200
logo,
+ (C + K ) (1 e )
E( CII ) = K (1 e 4 3 ) + 2C
Portanto
E( CII ) E( CI ) = C + K ( e 2 e 4 3 ) = C 013 . K
Conseqentemente, preferiremos o processo I, visto que C > 0.13K.
Distribuies - 24
x n1e x dx
n>0,
( n ) = ( n 1) ( n 1) , ou seja
( n ) = ( n 1)!
e x dx = 1
n>0.
Com o uso da funo gama, podemos introduzir a distribuio de probabilidade gama como: f (x) = ( x ) r 1 e x ( r ) =0 , x>0 , para outros valores
Os parmetros de tal fdp so r > 0 e > 0. O parmetro r chamado de parmetro de forma e parmetro de escala. A figura seguinte mostra uma distribuio gama para = 1 e r = 1, 2 e 3.
f (x ) r=1 r=2 =1
r=3
f ( x )dx = 0
1 ( x ) r 1 e x dx ( r ) 1 r 1 y 1 = y e dy = ( r ) = 1 ( r ) 0 ( r )
x
Distribuies - 25
para r = 1, f ( x ) = e x . Para r = v/2 e = 1/2 teremos uma importante distribuio chamada 2(v) (Qui-quadrado) que ser vista adiante, em estimao de parmetros.
Pode ser mostrado que a mdia e varincia da distribuio gama so dadas por:
E( X ) = r e Var ( X ) = r 2
e
F ( x) = 1 e
k =0 r 1 x
( x ) k x > 0, r > 0 k!
Uma bem conhecida utilizao da distribuio Gama decorre da seguinte proposio: Se uma varivel aleatria X a soma de r independentes distribuies exponenciais, com parmetro , ento X tem uma distribuio Gama com parmetros e r.
1 est ativa enquanto as unidades 2 e 3 esto inativas (stand by). Quando a unidade 1 falha, um determinado equipamento de deciso (DS) ativa a unidade 2. Caso a unidade 2 falhe, a unidade 3 , do mesmo modo, ativada. O equipamento de deciso assumido perfeito e o tempo de vida do sistema pode ser representado como a soma dos tempos de vida das unidades (X = X1 + X2 + X3). Se os tempos de vida das unidades so independentes um do outro e se as unidades tem cada uma um tempo de vida (Xj, j = 1, 2, 3), tendo densidade
g( x j ) = (1 / 100)e
x j /100
f (x) =
A probabilidade de que o sistema opere pelo menos x horas dado por R(x) e chamado de funo de confiabilidade, dado por:
R(x)=1-F(x)
Aqui,
Distribuies - 26
A distribuio de Weibull tem sido largamente utilizada em muitos fenmenos randmicos. A principal utilidade de tal distribuio que ela proporciona uma excelente aproximao para ser a fdp de muitas variveis aleatrias. Em resumo, as propriedades da distribuio de Weibull so:
x f (x) =
1
x ,x exp
2 2 1 Var ( X ) = 1 + 1 + 2
x F ( x ) = 1 exp
A figura seguinte mostra algumas dessas distribuies para r = 0, = 1 e = 1, 2, 3 e 4. Note que quando = 1 temos a distribuio exponencial com = 1/
f(x) 1.6 1.2 0.8 0.4 0.4 0.8 1.2 1.6 =1 =4 =3 =2 2.0 x
Distribuies - 27
Exerccios X
1 - A dureza de uma pea de cermica proporcional ao tempo de queima. Suponha que se conseguiu um processo de medio dessa dureza e que a medida respectiva seja uma v.a. distribuda uniformemente entre 0 e 10. Se a dureza de uma pea de cozinha deve estar no intervalo [5: 9], qual a probabilidade de uma pea escolhida ao acaso ser adequada ao uso na cozinha? 2- Um gelogo define o granito como uma rocha que contm quartzo, feldspato e pequena quantidade de outros minerais, desde que no contenha mais de 75% de quartzo. Se todas as percentagens so igualmente provveis, qual a proporo das amostras coletadas pelo gelogo em sua vida profissional que contero de 50 a 65% de quartzo? 3 - Uma companhia de seguros segurou um grupo de 10.000 indivduos de 28 anos de idade. Seus seguros entraram em vigor em 31 de agosto e o ano fiscal termina em 31 de dezembro. Pela tbua de mortalidade adotada, a probabilidade de um indivduo de 28 anos morrer dentro de um ano 0,0015. Se o valor do seguro de R$ 5.000,00 por morte, e se as mortes se distribuem uniformemente durante o ano, qual a reserva que a companhia deve constituir para fazer face aos sinistros que ocorrerem at o fim do ano fiscal? 4 - Um montanhista est perdido no flanco de uma montanha, fazendo sinal com sua lanterna para atrair a ateno de uma patrulha de salvamento. Se o tempo, em horas, que a lanterna capaz de emitir um feixe de luz visvel embaixo uma v.a. exponencial com parmetro =
1 : 6 1 = 1, 2, 3, 4, 5, 6.
a) qual a probabilidade de o sinal luminoso ser visto por ao menos 3 horas? b) construa uma tbua mostrando a resposta da parte (a) quando =
5 - O tempo de uma conversa telefnica tem distribuio exponencial com = 1 5. Se uma pessoa est com pressa de fazer uma ligao e outra pessoa chega antes dela cabine, qual a probabilidade de a primeira pessoa ter de esperar menos de 3 minutos para poder fazer a ligao?
Exerccios X - 1
Uma varivel aleatria X possui uma distribuio Normal (ou Gaussiana) se sua fdp for da forma
( 1 2 ) 1 f (x) = e 2 x
2
, < x <
A figura seguinte, a curva do sino (the bell curve), representa tal distribuio.
f(x)
f ( x )dx = 1
b) f(x) 0 c) lim f ( x ) = 0
x
lim f ( x ) = 0
Distribuies - 28
1 u
du
impossvel avaliar essa integral sem ajuda de mtodos numricos, e para cada avaliao h a necessidade do par de valores (;). Entretanto, uma simples transformao de variveis,
z= x ,
A fdp
(z) =
1 z 2 2 e 2
, < z <
tem mdia = 0 e varincia 2 = 1, isto Z: N(0; 1), e dizemos que Z tem uma Distribuio Normal Padronizada. O grfico de (z) e a transformao efetuada mostrada na figura seguinte.
(z)
-3
-2
-1
z x
-3 -2 -
+ +2 +3
( z ) =
z
1 u2 2 e du 2
Distribuies - 29
O procedimento usado na soluo de problemas envolvendo consulta a tabela normal reduzida bastante simples. Ex.: Suponha que X: N(100; 2) e que desejamos avaliar P(X 104). Temos ento
100 0 Pois z 0 =
104 z0 = 2
x z
Observe a relao entre o argumento de F e o argumento de , o qual mede a distncia de x mdia em unidades de desvio padro (). No caso considerado F(104) = (2) indica que 104 est dois desvios padres ( = 2) acima da mdia. Na soluo de problemas, algumas vezes necessitamos usar a propriedade de simetria de (z).
Ex.: A tenso de ruptura (em newtons) de uma fibra sinttica representada por X
e distribuda como N(800; 12). O controle de qualidade na fabricao da fibra exige uma tenso de no mnimo 772 N. Uma amostra da fibra randomicamente testada. A probabilidade de obtermos P(X 772) obtido a partir de:
x 772 800 P ( X < 772 ) = P < 12 = P ( Z < 2.33) = ( 2.33) = 0.01
Assim, a probabilidade desejada, P(X 772) igual a 1 - P(X < 772) = 0.99 como mostra a figura seguinte.
Distribuies - 30
=3
=1
772
800
-2.33
de alimentos em um complexo processo de produo X minutos. Estudos mostram que X ~ N(120, 4) uma boa aproximao para X. Se o processo interrompido por mais de 125 minutos todos os equipamentos devem ser limpos com a perda dos alimentos em processo. O custo total desta perda aproximadamente $ 10.000. No sentido de determinar a probabilidade desta ocorrncia podemos proceder como a seguir:
125 120 = P ( Z > 125 . ) P ( X > 125) = P Z > 4 . ) = 1 0.8944 = 1 (125 . = 01056
Assim, dada uma falha na mquina, o custo esperado E(C) ser dado por: E(C) = 0.1056 (10000 + CR1) + 0.8944 CR1 onde C representa o custo total CR1 representa o custo de reparo Simplificando temos: E(C) = CR1 + 1056
Suponha que um gerenciamento pode reduzir a mdia da distribuio do tempo de reparo para 115 minutos pela adio de mais pessoal de manuteno. O novo custo de reparo ser CR2 > CR1. Temos agora que:
125 115 = P ( Z > 2.5) P ( X > 125) = P Z > 4 = 1 ( 2.5) = 1 0.9938 = 0.0062
Distribuies - 31
Poderamos agora avaliar se esta segunda alternativa melhor por meio da confirmao de que: CR2 + 62 < CR1 + 1056 ou CR2 - CR1 < $ 994
tenham uma variao normal com mdia 60 Hz e desvio padro 15 Hz. A) Qual a probabilidade desse sinal eltrico possuir componentes entre 40 e 70 Hz devido a essas freqncias indesejveis? Temos que:
P ( 40 X 70) = P ( 133 . < Z < 0.67) = ( 0.67) ( 133 . ) = 0.748 0.09 = 0.65 = 65 %
40
60
70
B) Qual a maior freqncia do sinal para que a probabilidade de contaminao por freqncias indesejveis seja de 10%? Nesse caso temos um outro caminho:
Distribuies - 32
freqentemente. So eles: P( - 1.00 X 1.00 ) = 0.6826 P( - 1.645 X + 1.645 ) = 0.90 P( - 1.96 X + 1.96 ) = 0.95 P( - 2.57 X + 2.57 ) = 0.99 P( - 3.00 X + 3.00 ) = 0.9978
A combinao linear de variveis aleatrias com Distribuies Normais independentes tambm uma distribuio Normal. Por exemplo: Se X : N ( x , x ) e Y: N ( y , y ) ento
W = aX + bY + c
ter distribuio normal com:
w = a x + b y + c e
2 2 2 2 2 w = a x + b y
Distribuies - 33
Exerccios XI
1 - Se X uma v.a. N(95; 7,5), determinar b tal que: a) P( X > b) = 0,975; b) P( X > b) = 0,8708 2 - A vida mdia de certo aparelho de oito anos, com d.p. de 1,8 ano. O fabricante substitui os aparelhos que acusam defeito dentro do prazo de garantia. Se ele deseja substituir no mximo 5% dos aparelhos que apresentem defeito, qual deve ser o prazo de garantia? 3 - Um processo industrial produz peas com dimetro mdio de 2.00 e d.p. de 0,01. As peas com dimetro que se afaste da mdia por mais de 0,03 so consideradas defeituosas. admitida a normalidade: a) qual a percentagem das peas defeituosas? b) qual a probabilidade de encontrar duas peas defeituosas em seqncia? c) qual probabilidade de encontrar duas peas perfeitas em seqncia? 4 - Em um exame de estatstica, a nota mdia foi 70, com d.p. 4,5. Todos os alunos que obtiveram nota 75 a 89 receberam conceito B. Se as notas tm distribuio aproximadamente normal, e se 10 estudantes obtiveram conceito B, quantos se submeteram ao exame? 5 - As alturas de 500 estudantes de uma faculdade tm mdia 1,70 m e d.p. 0,75 m. Supe-se normal a distribuio das alturas. a) Quantos tm altura inferior a 1,75 m? b) Entre 1,72 e 1,80 m? c) Igual a 1,74 m? 6 - Se um conjunto de valores tem distribuio normal, qual a percentagem dos valores que distam da mdia: a) Por mais de 1,3 ; b) Por menos de 0,52 ? 7 - Uma empresa usa anualmente milhares de lmpadas eltricas, que permanecem acesa continuamente, dia e noite. A vida de uma lmpada pode ser considerada uma v.a. normal, com mdia de 50 dias e d.p. de 15 dias. Em 1o de janeiro a companhia instalou 8.000 lmpadas novas. Aproximadamente quantas devero ser substitudas em 1o de Exerccios XI - 1
fevereiro? 8 - Seja X o nmero de sucessos em n provas de Bernoulli com probabilidade p de sucesso. Pede-se: a) Determinar as probabilidades exatas de X 6 se n = 25 e p = 0,35. 9 - Se a ocorrncia de falhas uma v.a. de Poisson com mdia 0,2 por m2, qual a probabilidade de o nmero de falhas em 5.000 m2 de tecido: a) estar entre 975 e 1025; b) ser superior a 980. 10 - Determinar a probabilidade de obter sete caras em 14 jogadas de uma moeda. 11 - Um laboratrio alega que um produto seu cura 80% dos casos de certa doena. Para verificar a afirmao, uma equipe mdica do governo testou o produto em 100 indivduos portadores da doena e decidiu aprov-lo se houver no mnimo 75% de curas. a) qual a probabilidade de a afirmao do laboratrio ser rejeitada, quando a probabilidade de cura de fato 0.8? b) qual a probabilidade de a afirmao ser aceita, se a probabilidade de cura de fato 0,7? 12 - Joga-se um par de dados 180 vezes. Qual a probabilidade de ocorrncia do total 7: a) ao menos 25 vezes? b) entre 33 e 41 vezes? c) exatamente 30 vezes? 13 - Joga-se o par de dados 200 vezes. Qual a probabilidade de um nmero de duplas (dois 1, dois 2, ...). a) estar entre 40 e 50? b) ser igual ou superior a 25? c) ser inferior ou igual a 40? 14 - Em uma turma de histria, o exame final acusou mdia 72,5 e d.p. 11,2 (nota mxima 100). Se a distribuio das notas pode ser considerada aproximadamente normal, que percentagem delas excede 80? 15 - Em um posto de grande movimento, os automveis entram razo de trs em cada dois minutos, em mdia. Determinar a probabilidade de mais de 100 automveis procurarem o posto no perodo de uma hora. Exerccios XI - 2
Populao
Amostragem
tros da distribuio a serem utilizados para uma determinada populao. Ex.: Para a os
Inferncia Estatstica
distribuio
normal
parmetros so e 2, para as distribuies de Poisson e Exponencial o parmetro , etc. Aqui os termos populao e distribuio so
As
amostras, so os
elementos da populao tem a mesma probabilidade de serem escolhidos. Com isso tentamos garantir que toda a variabilidade presente na populao estar refletida na amostra. Outra conseqncia desse carter aleatrio que o conhecimento de um elemento qualquer nada nos informa quanto ao valor dos outros elementos. (O processo de amostragem ser visto adiante - Cap.6).
Estimao - 1
A figura seguinte descreve o processo de inferncia estatstica aplicado a uma determinada populao. Qualquer valor calculado com base nos elementos de uma amostra chamado uma estatstica. Por exemplo, a mdia amostral, ou seja, a mdia dos elementos da amostra ~ ( X ), uma estatstica, assim como o so a mediana amostral ( X ), a amplitude amostral (h), etc. As estatsticas variam de uma para outra amostra, sendo pois, elas prprias variveis aleatrias. Podemos, assim, falar de populao de mdias amostrais, de medianas amostrais ou, equivalentemente, de distribuio das mdias amostrais, das medianas amostrais, etc.
Populao (Caractersticas verdadeiras desconhecidas) Varivel aleatria X - < x < com distribuio f(x) = P(X = x) f(x) Inferncia Amostragem (Observao Experimental) Amostra {X1, X2, ... Xn}
Modelo Terico
Ex.:
Estimao - 2
Ex.: Para uma populao de 200 valores que variam entre -5 e 5 temos a seguinte
ni
45 40 35 30 25 20 15 10 5 0 -5 -4 -3 -2 -1 0 1 2 3 4 5 X
xi -5 -4 -3 -2 -1 0 1 2 3 4 5
ni 1 3 10 23 39 48 39 23 10 3 1
Extraindo uma amostra aleatria de tamanho 10 desta populao obtemos as seguintes oito amostras que esto relacionadas juntamente com as respectivas mdias e medianas amostrais.
Amostra 1 2 3 4 5 6 7 8 1 2 -1 -1 -2 1 0
Valores 0 -3 0 2 1 -1 0 1 0 2 2 0 -2 0 1
~ X
0 1 -1
1 -1
4 -2 -2 -1 0 1 2 0 0 2 -3 0 0
1 -1 -1 1 -3
1 -5 1 -2
0 -2
1 -2 -0.40 2 -1 0 -040
-1 -1 0 0
3 -2 -1 -4 0 3 0 -5 1 2 1 0
1 -1 -1 1 0 0
1 -0.10 080
3 -2
Estimao - 3
Em tal extrao pode ser utilizada uma tbua de nmeros aleatrios (Ver Tabela 4) ou um processo computadorizado (tipo random) para gerar uma seqncia aleatria de nmeros. Se de alguma forma, por exemplo, obtermos os nmeros aleatrios 097, 019, 065, 060, 124, 104, 196, 058, 179, 155 podemos associ-los aos valores em Ni da tabela e extrair a seguinte amostra: 0, -2, -1, -1, 0, 0, 3, -1, 2, 1. (confira)
Para facilitar a linguagem usada em Inferncia Estatstica, iremos diferenciar as caractersticas da amostra e da populao. Os smbolos mais comuns so dados a seguir:
Populao
2
N p
$ p
$
Geral
Estimao - 4
Populao
Amostras
$ 1 $ 2
1 X 2 M k
$) f (
$ 3
$) E(
$ i
$ . Os valores $ da estatstica $ formam uma onde para cada amostra, calculamos o valor i i $. nova populao, a Distribuio Amostral da estatstica $ como uma estimativa de , no esperamos realmente que $ Quando propomos $ uma v.a. e, por isso, pode tomar diferentes venha a ser igual a . (Recordemos que
valores). Este dilema origina duas importantes questes: 1. Quais as caractersticas que desejamos que uma boa estimativa apresente? 2. Como decidiremos que uma estimativa melhor do que a outra? Tais questes no admitem uma anlise to simples. Em primeiro lugar, o prprio valor do parmetro no verdadeiramente correto (ao menos em uma situao concreta).
$ o ? Segundo, se tivermos duas estimativas de , por exemplo $ e Assim, como dizer que 0
$ , qual o critrio de comparao para decidirmos entre $ e $ ? Observe que isto no um 1 0 1
problema como, por exemplo, no clculo de razes da equao 3x 5 4 x 2 + 13x 7 = 0 . Uma vez que se tenha achado uma soluo, muito simples verificar se ela a soluo correta: precisaramos apenas substitu-la na equao dada. Se tivermos duas respostas aproximadas, digamos r1 e r2, ser tambm assunto simples de decidir qual das aproximaes a melhor.
A estimao de um parmetro populacional pode ser de dois tipos: estimao pontual e estimao intervalar. A estimao pontual procura fixar um valor numrico nico que esteja satisfatoriamente prximo do verdadeiro valor do parmetro. A estimativa intervalar procura determinar intervalos com limites aleatrios, que abranjam o valor do parmetro populacional, com uma margem de segurana prefixada.
Estimao - 5
H vrios mtodos de obteno de estimadores, destacando-se entre eles o Mtodo da Mxima Verossimilhana. Seu estudo, entretanto, ultrapassa o nvel deste texto. Como existem muitos estimadores para um mesmo parmetro de uma populao, necessrio estudar algumas propriedades que os distingam uns dos outros. Duas delas so: notendenciosidade e varincia mnima. Seja X uma v.a. cuja distribuio dependa do parmetro . Seja X1, X2, ... Xn uma
$ uma funo da amostra. (Portanto, $ uma v.a. amostra aleatria de X e seja $ uma unidimensional cuja distribuio de probabilidade depende de ). Ns diremos que
$ ) = para todo . estimativa no-tendenciosa de se E (
$ uma estimativa no-tendenciosa de . Diremos que $ uma estimativa de Seja $ * tais que E ( $ * ) = , tivermos varincia mnima de , se para todas as estimativas
$ e $ forem duas estimativas de , cuja fdp seja representada na Assim, se 1 2 $ a $ . figura seguinte, presumivelmente preferiramos 1 2
$ ) h( 1
$ ) g( 2
$ e $ , (ver figura abaixo) a deciso no to evidente, No caso de estimativas 3 4 $ no-tendenciosa, enquanto $ tendenciosa. Todavia Var ( $ ) > Var ( $ ) . Isto porque 3 4 3 4 $ ser prxima de , sua varincia revela que desvios significa que, enquanto em mdia 3 $ por sua vez, tende a ser um tanto considerveis em relao a no sero de surpreender. 4 $ . maior do que , em mdia, e no entanto poder ser mais prxima de do que 3
Estimao - 6
$ ) h( 4
$ ) g( 3
uma v.a., baseada em uma amostra X1, X2, ... Xn. Muito embora, intuitivamente, pudssemos considerar
que esta estatstica tem um valor esperado diferente de 2 , ou seja 1 n $ Para = ( X i X ) 2 n i=1
$ ) = ( n 1) 2 E( n
1 n ( X X )2 , verifica-se n i=1 i
Por isso, uma estimativa no-tendenciosa de 2 ser obtida tomando-se 1 n 2 $ $ ) = E( S 2 ) = 2 = S = ( X i X )2 e E( n 1 i=1 De fato:
( X
X ) 2 = ( X i + X ) 2 = [( X i ) + ( X )] 2 = [ ( X i ) 2 + 2( X )( X i ) + ( X ) 2 ] = ( X i ) 2 + 2( X ) ( X i ) + n( X ) 2 = ( X i ) 2 2n( X ) 2 + n( X ) 2 = ( X i ) 2 n( X ) 2 = n 2 2 = 2 (n 1)
Portanto:
1 n 1 E ( Xi X )2 = [ 2 (n 1)] = 2 n 1 i =1 n1
Estimao - 7
Ex.: Considere uma urna que contenha trs espcies de objetos, identificados
como 0, 1 e 2, em quantidades 20, 30 e 50 respectivamente. Um valor extrado aleatoriamente e seu valor, digamos X, registrado. X tem ento a seguinte distribuio:
P(X = x)
X P(X=x)
0 0.2
1 0.3
2 0.5
x 0 1 2
Suponha agora que o objeto extrado em primeiro lugar seja reposto na urna e a seguir, um segundo objeto seja extrado e seu valor, digamos Y, seja registrado. Considere a v.a. M = M 0 1/2 0.12 1 0.29 3/2 0.30
X +Y e sua distribuio 2
2 0.25
P(M=m) 0.04
P(M = m)
m 0 1/2 1 3/2 2
onde os valores de P(M = m) foram calculados da seguinte forma: P( M = 0) = P( X = 0, Y = 0) = ( 0.2) = 0.04 P( M = 1 2) = P( X = 0, Y = 1) = P( X = 1, Y = 0) = ( 0.2)( 0.3) + ( 0.3)( 0.2) = 012 .
2
etc.
Estimao - 8
Finalmente, considere pelo mesmo processo uma terceira extrao, digamos Z, e a seguinte v.a. N =
X +Y +Z com sua respectiva distribuio de probabilidade: 3
1/3
2/3
4/3
5/3
As distribuies de probabilidades das v.a. M e N j esto mostrando sinais de normalidade, isto , a aparncia da curva em sino da distribuio normal est comeando a surgir. Partindo da distribuio de X, a qual quase assimtrica verificamos que a mdia de apenas trs observaes tem uma distribuio que j est mostrando indicaes de normalidade.
Naturalmente, o exemplo acima no demonstra coisa alguma. No entanto, ele representa uma ilustrao numrica do importante resultado dado a seguir: Para uma populao no normal com mdia e desvio padro , a distribuio da mdia amostral
X ~ N : (0,1) n
Tal resultado, bastante surpreendente, constitui o chamado Teorema Central do Limite. Assim, mesmo para populaes no normais, a distribuio da mdia X aproximadamente normal. (Alguns textos referem-se erroneamente ao Teorema do Limite Estimao - 9
Central; o que central o teorema e no o limite.) A demonstrao de tal teorema foge em muito ao escopo desse texto.
Ex.: Suponha que temos algumas correntes eltricas independentes, por exemplo
Ii, i = 1, 2 ... n, as quais so recebidas em um somador, como na figura seguinte. Seja I a soma das correntes recebidas. Isto I = I i . Suponha que cada varivel aleatria Ii seja
i=1 n
aleatria
... I3
Z=
I n
ter
uma
distribuio
Desta forma
10 I : N 5; 12 e:
Z=
I 5 ~ N ( 0,1) 10 1 . 12 n
Z=
Seja X1, X2, ... Xn uma seqncia de variveis aleatrias independentes, com E ( X i ) = e Var ( X i ) = 2 , i = 1, 2, ... n. Faamos X = X1 + X2 +... + Xn. Ento:
Z=
X n
. n
Um outro importante resultado relacionado ao teorema central do limite : Quando a populao normal N ( ; ) , a mdia amostral X de amostras de tamanho n tem distribuio tambm normal com mdia e desvio padro
n , isto :
X u ~ N : (0,1) n
Os resultados apresentados nesta seo sero amplamente utilizados nos prximos captulos.
Estimao - 11
Exerccios XII
01 - Uma varivel aleatria X tem distribuio normal, com mdia 100 e desvio padro 10. a) Qual a P(90 < X < 110)? b) Se X a mdia de uma amostra de 16 elementos retirados dessa populao, calcule
P (90 < X < 110 ) .
probabilidade de voc ganhar um prmio? c) Baseado nos resultados acima, qual o melhor tamanho de amostra para participar do jogo? 06 - A distribuio dos comprimentos dos elos de corrente de bicicleta normal, com mdia 2 cm e varincia igual a 0,01 cm2. Para que uma corrente se ajuste bicicleta, deve ter comprimento total igual entre 58 e 61 cm. a) Qual a probabilidade de uma corrente com 30 elos no se ajustar bicicleta? b) E uma corrente com 29 elos? 07 - Cada seo usada para construo de um oleoduto tem um comprimento mdio de 5 m e desvio padro de 20 cm. O comprimento total do oleoduto ser de 8 km. a) Se a firma construtora do oleoduto encomendar 1.600 sees, qual a probabilidade de terem que comprar mais do que uma seo adicional (isto , das 1.600 sees somarem 7.995 m ou menos)? b) Qual a probabilidade de uso exato de 1.599 sees, isto , a soma das 1.599 sees estar entre 8.000 e 8.005 m? 08 - A distribuio dos salrios (em salrios mnimos) de operrios do sexo masculino de uma grande fbrica N(5,4; 1.3), e a de operrios do sexo feminino N(5,4; 1.5). Sorteiam-se duas amostras, uma com 16 homens e outra com 16 mulheres. S D a diferena entre o salrio mdio dos homens e das mulheres: a) Calcule P D > 0,5 . b) Qual o valor de d tal que P D > d = 0,05 ? c) Que tamanho comum deveriam ter ambas as amostras para que P D > 0,4 = 0,05 ?
Exerccios XII - 2
4.4.1 - Mdia e varincia de uma populao normal N(; ) No de se admirar que o melhor estimador da mdia populacional ( ) seja a mdia amostral ( X ) :
X=
1 ( X + X 2 + L+ X n ) , n 1
Assim,
E( X ) = 1 1 E ( X 1 + X 2 +...+ X n ) = E ( X 1 ) + E ( X 2 ) + ... + E ( X n ) n n 1 n = [ + + L + ] = = n n
] ]
Var ( X ) =
revela que quanto maior o valor de n, menor a sua variabilidade. Assim, neste caso, sendo
$= X. = , adotaremos
Para a varincia populacional ( 2 ) o estimador S2, com S 2 =
1 n ( X X )2 , n 1 i=1 i
Ex.: Se de uma populao normal N ( ; ) extramos amostras cujos valores so: 1.1 0.9 0.3 -0.2 -3.1 1.5 -2.7 0.5 -1.5 2.1, obtenha estimativas pontuais de , 2 e P(X > 2.5). Estimativa de :
X=
Estimao - 12
Estimativa de 2 :
4.4.2 - Mdia e varincia de uma proporo (p) Consideremos agora o caso em que = p , de uma populao que apresenta certa caracterstica. Extrai-se da populao uma amostra de tamanho n. X ser o nmero de elementos da amostra que apresentam a caracterstica em estudo. intuitivo que um
As observaes dos n elementos podem ser considerados como n provas de Bernoulli com probabilidade de sucesso p, ou seja, X tem distribuio binomial com mdia np e varincia npq. Conseqentemente, temos:
Ex.: Para se avaliar a taxa de desemprego em determinado Estado, escolhe-se uma amostra aleatria de 1000 habitantes em idade de trabalho e contam-se os desempregados: 87. Estimar a proporo de desempregados em todo o Estado (populao). Avaliar o erro padro de estimativa. Estimao - 13
Temos ento:
$ = 8.7% p Logo: p ~
Logo ~ 0.009
At agora estivemos tratando apenas de obter uma estimativa pontual de um parmetro desconhecido. Como mencionado anteriormente, h outra maneira de tratar o assunto que freqentemente conduz a resultados muito significativos. Seja ento X1 , X 2 , L, X n uma amostra aleatria de uma populao e o
$ e $ estatsticas tais que: parmetro de interesse. Sejam 0 1 ) P ( $0 < < 1 ) = 1 ) Ento [$0 ; 1 ] chamado intervalo de confiana de nvel 100(1 - ) % para o parmetro .
Muitas estatsticas consideram a construo de intervalos de confiana como o principal mtodo de estudo de um parmetro populacional atravs de uma amostra. Ex.: Consideremos uma populao normal com mdia e desvio padro e uma amostra dessa populao. Sabemos pelos resultados do Teorema Central do Limite que a mdia X desta amostra tem distribuio normal com mdia e desvio padro
n , ou seja:
X u ~ N : (0,1) n
Fixando em 0.05, ou seja, 1 = 0.95 , vemos pela tabela de distribuio normal padronizada z, que:
Estimao - 14
-1.96
1.96
P [ X 196 . (
n )] = 0.95
n ); X + 196 . (
n ) o intervalo de con-
fiana de 95% para , IC( : 95%) importante observar que o nvel de confiana (1 - ) se aplica ao processo de construo de intervalos, e no a um intervalo especfico. Para explicitar o conceito de intervalo de confiana, suponha que retiremos um grande nmero de amostras de tamanho n, fixo, da populao em estudo e, para cada amostra, construamos um intervalo. Os limites dos intervalos resultantes sero diferentes. O verdadeiro valor do parmetro estar contido, em mdia, em 100(1 - )% desses intervalos, ou seja, 100(1 - )% dos intervalos construdos abrangero o verdadeiro valor do parmetro, no caso , conforme ilustrado na figura seguinte, mas cada valor contm, ou no contm, o parmetro.
Estimao - 15
Obs.: A expresso do tipo P X 196 . (
n ) = 0.95 deve
cair dentro de um intervalo especificado seja igual a 0.95. sendo o parmetro, est ou
no est dentro do intervalo acima. De preferncia a expresso acima deve ser interpretada assim: 0.95
. ( [ X 196
probabilidade
de
que
um
intervalo
aleatrio
n ) ; X + 196 . (
n ) contenha .
Ex.: Para uma amostra de 50 observaes de uma populao normal com mdia desconhecida e desvio padro = 6 , seja 20.5 a mdia amostral X . Construir um intervalo
de 95% de confiana para a mdia populacional. Temos, de imediato que:
P X 196 . (
n ) = 0.95
Estimao - 16
A figura seguinte representa a curva N(0,1) e a notao que iremos utilizar, onde
P Z < Z 2 = 1
1- /2 -z/2 0 +z/2
/2
z=
Assim: P X Z 2 (
n ) < < X + Z 2 (
n) = 1
n ) ; X + Z 2 (
n)
Obs.: Para
= 5% = 1%
2 = 2.5% 2 = 0.5%
Z 2 = 196 . , Z 2 = 2.58 .
(Confira!)
Estimao - 17
Exerccios XIII
01 - Um procedimento de controle de qualidade foi planejado para garantir um mximo de 10% de itens defeituosos na produo. A cada 15 minutos sorteia-se uma amostra de 20 peas, e, havendo mais de 15% de defeituosos, pra-se a produo para verificaes. Qual a probabilidade de uma parada desnecessria? 02 - Se uma amostra com 36 observaes tomada de uma populao, qual deve ser o tamanho de uma outra amostra para que o erro padro desta amostra seja 2/3 do erro padro da mdia da primeira amostra? 03 - Definimos a varivel e = X como sendo o erro amostral da mdia. Suponha que a varincia dos salrios de uma certa regio seja 400 unidades ao quadrado. a) Determine E(e) e Var(e). b) Que proporo das amostras de tamanho 25 tero erro amostral absoluto maior do que 2 unidades? c) E que proporo das amostras de tamanho 100? d) Neste ltimo caso, qual o valor de d, tal que P e > d = 1%? e) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais absolutos sejam inferiores a uma unidade? 04 - Um professor d um teste rpido, constante de 18 questes do tipo certo-errado. Para testar a hiptese de o estudante estar adivinhando a resposta, ele adota a seguinte regra de deciso: Se 12 ou mais esto corretas, ele no est adivinhando. Qual a probabilidade de rejeio da hiptese, quando verdadeira? 05 - Um distribuidor de sementes determina, atravs de testes, que 5% das sementes no germinam. Ele vende pacotes de 200 sementes com garantia de 90% de germinao. Qual a probabilidade de um pacote no satisfazer a garantia? 06 - A experincia indica que 60% dos passageiros de vos interestaduais preferem refeies quentes, enquanto os restantes 40% preferem refeies frias. Para cada vo, acham-se disponveis 72 refeies quente e 48 frias. Se 100 passageiros tomam o avio, perguntase: a) Qual o nmero mximo de passageiros que podem receber refeies quentes? Neste caso, quantos recebero refeies frias? b) Qual o nmero mximo de passageiros que podem receber refeies frias? Neste caso, Exerccios XIII - 1
qual o nmero mnimo de passageiros que podem pedir refeies quentes? c) Quais os nmeros mnimos e mximos de refeies quentes que podem ser pedidas de modo que todos recebem a refeio de sua preferncia? d) Qual a probabilidade de que cada passageiro receba a refeio de sua preferncia?
estimador? 09 - Calcule o intervalo de confiana para a mdia em cada um dos casos abaixo. Mdia Amostral Tamanho da Amostra Desvio Padro da Populao 170 cm 165 cm 180 cm 100 184 225 15 cm 30 cm 30 cm Coeficiente de Confiana 95% 85% 70%
10 - De 50.000 vlvulas fabricadas por uma companhia retira-se uma amostra de 400 vlvulas, e obtm-se a vida mdia de 800 horas e o desvio padro de 100 horas. a) Qual o intervalo de confiana de 99% para a vida mdia da populao? b) Com que confiana dir-se-ia que a vida mdia 800 0,98? c) Que tamanho deve ter a amostra para que seja de 95% a confiana na estimativa 800 7,84? (Que suposies voc fez para responder s questes acima?) 11- Qual deve ser o tamanho de uma amostra cujo desvio padro 10 para que a diferena da mdia amostral para a mdia da populao, em valor absoluto, seja menor que 1, com coeficiente de confiana igual a: a) 95% b) 99%
Exerccios XIII - 2
12 - Uma populao tem desvio padro igual a 10. a) Que tamanho deve ter uma amostra para que, com probabilidade 8%, o erro em estimar a mdia seja superior a 1 unidade? b) Supondo-se colhida a amostra no caso anterior, qual o intervalo de confiana, se x = 50?
13 - Uma amostra aleatria de 625 donas-de-casa revela que 70% delas preferem a marca X de detergente. Construir um intervalo de confiana para p = proporo das donas-de-casa que preferem X com c.c. = 90% 14 - Encontre os intervalos de confiana para p se k/n = 0,3, com c.c. = 0,95. Utilize os dois enfoques apontados na seo 9.5, com n = 400. 15 - Antes de uma eleio, um determinado partido est interessado em estimar a proporo p de eleitores favorveis ao seu candidato. Uma amostra piloto de tamanho 100 revelou que 60% dos eleitores eram favorveis ao candidato em questo. a) Determine o tamanho da amostra necessrio para que o erro cometido na estimao seja de, no mximo 0,01 com probabilidade de 80%. b) Se na amostra final, com tamanho igual ao obtido em (a), observou-se que 55% dos eleitores eram favorveis ao candidato em questo, construa um intervalo de confiana para a proporo p. (Utilize = 0,95). 16 - Suponha que estejamos interessados em estimar a porcentagem de consumidores de um certo produto. Se uma amostra de tamanho 300 forneceu 100 indivduos que consomem o dado produto, determine: a) O intervalo de confiana de p, com coeficiente de confiana de 95% (interprete o resultado). b) O tamanho da amostra para que o erro da estimativa no exceda a 0,02 unidades com probabilidade de 95% (interprete o resultado) 17 - Da experincia passada, sabe-se que o desvio padro da altura de crianas de 5a srie do 1o grau 5 cm. a) Colhendo uma amostra de 36 dessas crianas, observou-se a mdia de 150 cm. Qual o intervalo de confiana de 95% para a mdia populacional? b) Que tamanho deve ter uma amostra para que o intervalo 150 0,98 tenha 95% de confiana?
Exerccios XIII - 3
18 - Um pesquisador est estudando a resistncia de um determinado material sob determinadas condies. Ele sabe que essa varivel normalmente distribuda com desvio padro de 2 unidades. a) Utilizando os valores 4,9; 7,0; 8,1; 4,5; 5,6; 6,8; 7,2; 5,7; 6,2 unidades, obtidos de uma amostra de tamanho 9, determine o intervalo de confiana para a resistncia mdia com um coeficiente de confiana = 0,90. b) Qual o tamanho da amostra necessrio para que o erro cometido, ao estimarmos a resistncia mdia, no seja superior a 0,01 unidades com probabilidade 0,90? c) Suponha que no item (a) no fosse conhecido o desvio padro. Como voc procederia para determinar o intervalo de confiana, e que suposies voc faria para isso? 19 - Estime o salrio mdio dos empregados de uma indstria txtil, sabendo-se que uma amostra de 100 indivduos apresentou os seguintes resultados: U.m. 150,00 250,00 250,00 350,00 350,00 450,00 450,00 550,00 (Use = 0,95) 550,00 650,00 650,00 750,00 Freqncia 8 22 38 28 2 2
20 - Numa pesquisa de mercado para estudar a preferncia da populao de uma cidade em relao a um determinado produto, colheu-se uma amostra aleatria de 300 indivduos, dos quais 180 preferiam esse produto. a) Determine um intervalo de confiana para a proporo da populao que prefere o produto em estudo (=5%). b) Determine a probabilidade de que a estimativa pontual dessa proporo no difira do verdadeiro valor em mais de 0,001. c) possvel obter uma estimativa pontual dessa proporo que no difira do valor verdadeiro em mais de 0,0005 com probabilidade 0,95? Caso contrrio, determine o que deve ser feito.
Exerccios XIII - 4
21 - Antes de uma eleio em que existiam 2 candidatos A e B , foi feita uma pesquisa com 400 eleitores escolhidos ao acaso, e verificou-se que 208 deles pretendiam votar no candidato A. Construa um intervalo de confiana, com c.c. = 0,95, para a porcentagem de eleitores favorveis ao candidato A na poca das eleies. 22 - Suponha que uma amostra de n = 100 de uma distribuio normal N(, ) forneceu X = 510,6 . Supondo 2 conhecido e igual a 16, obtenha um intervalo de confiana para
, com c.c. = 0,95.
Exerccios XIII - 5
4.7 - Estimativa Intervalar da Mdia de uma populao normal, desconhecido (distribuio t de Student)
intuitivamente evidente que a distribuio de probabilidade da v.a. t deve ser muito mais complicada do que a de Z = ( X )
numerador e denominador, so v.a. enquanto Z apenas uma funo linear de X 1 , X 2 , L , X n . A distribuio de t dada por:
[( v + 1) 2] t 2 hv ( t ) = 1 + v ( v 2 ) v
( v +1) 2
, < t <
O grfico de hv(t) simtrico, como est apresentado na figura seguinte. De fato, ele se assemelha ao grfico da distribuio normal e pode-se verificar que:
v
lim hv ( t ) = (1
2 ) e t 2 ,
2
t Para cada valor de v, temos uma distribuio diferente e, assim, em princpio, precisaramos de um grande nmero de tabelas dessa distribuio. Uma situao intermediria Estimao - 18
consiste em apresentar, apenas para algumas combinaes de valores de v e 1 , os valores b tais que P [ b < t < b] = 1 . b denotado por t 2 .
A partir desse ponto podemos calcular o intervalo de confiana para a mdia , sendo desconhecido:
1-
/2
- t/2
X P t 2 < < t 2 = 1 S n
/2
t
0 t/2
n ) < < X + t 2 ( S
n ) = 1 , ou seja:
IC ( : (1 )100) = X t
(S
n ) ; X + t
(S
n)
Ex.: Dez mensuraes so feitas para a resistncia eltrica de um certo tipo de fio,
Estimao - 19
[10.48 (1.83)(1.36
[9.65;1131 . ]
10
)]
estatstico ingls W. S. Gosset, que publicou sua pesquisa sob o pseudnimo de Student.
J vimos que uma estimativa pontual no-tendenciosa da varincia populacional a varincia amostral S2, com
S2 = 1 n ( X X )2 n 1 i=1 i
Y=
(n 1)S 2
Essa estatstica tem distribuio 2 , chamada qui-quadrado ( , letra do alfabeto grego que pode ser pronunciada aproximadamente como qui em portugus) se a populao normal. Ou seja: Y: 2 (v) Conforme mencionado anteriormente (Captulo 1) a distribuio 2 um caso Estimao - 20
v 2
e se uma v.a. Y, que tenha fdp dada por tal equao, ter ento uma distribuio qui-quadrado, com v graus de liberdade. Na figura seguinte a fdp est apresentada para v = 1, 2 e v > 2.
f(y) v=1
f(y) v=2
f(y) v>2
Em virtude de sua importncia, a distribuio 2 est tabelada para diversos valores do parmetro v (Veja Tabela 6). Tal tabela fornece os valores da abscissa da distribuio para diversas reas (probabilidades) da cauda direita. Assim:
1-
Estimao - 21
Podemos agora calcular o intervalo de confiana para a varincia 2 por meio de:
2 P 1 < Y < 2 2 =1
/2
1-
/2
22
12
Y:2
Assim,
Estimao - 22
certa empresa: 46.4 46.1 45.8 47.0 46.1 45.9 45.8 46.9 45.2 46.0
Admitindo normal a distribuio dos pesos, determinar um intervalo de 95% de confiana para a varincia de todos os pacotes (populao) expedidos pela empresa. Temos nesse caso que:
x = 4612 .
S2 = 1 n ( x i x ) 2 = 0.286 n 1 i=1
= 2.5% , 2 v = 10 1 = 9
= 5% ,
2.5%
4.9 - Estimativa Intervalar de Duas varincias de uma populao normal (distribuio F - Fisher/Snedecor)
Uma terceira distribuio muito usada em inferncia, envolve o quociente de duas variveis do tipo 2 . ela a distribuio F, de Fisher-Snedecor.
Estimao - 23
W:F(v1 ,v2)
1-
Para encontrar os valores inferiores, usa-se a identidade: F(v1 ,v2 )=1/ F(v2 ,v1 )
O valor f0 tal que P(F(5,7)< f0 )=5% pode ser obtido da seguinte forma: P(F(5,7)< f0 )=5% P(1/F(7,5)< f0 )=5% P(F(7,5)> 1/f0 )=5% Logo, 1/f0 = 4.88 (tabela) e f0 =0.205.
Estimao - 25
Exerccios XIV
01 - Suponha que X : N(, ), e desconhecidos. Uma amostra de tamanho n = 600 forneceu X = 10,3 e S2 = 1,96. Supondo que a v.a. Z =
X seja aproximadamente S n
normal, obtenha um IC para , com c.c. = 0,95. (Se n pequeno, Z no aproximadamente normal). 02 - Chamando de t(v; ) o valor y, tal que P( t > y | v ) = , e usando os valores da Tabela 5, calcule: a) t (1; 5%) b) t ( 6; 10%) c) t (10; 95%) d) t (15; 2,5%) e) t ( 20; 80%) f) t (120; 0,1%)
b) Sabendo-se que P(S2 < a) = 5% e P(S2 > b) = 5%, encontre a e b. c) P(S2 < 163,16) = , encontre . d) P(S2 > 100) = , encontre . e) P(S2 < 80) = , encontre . f) Se o valor observado de S2 foi 180, qual a probabilidade de encontrar uma amostra que produza um S2 maior do que o observado?
Exerccios XIV - 1
06 - Indicando por F ( v1 ; v2 ; ) o nmero y, tal que P ( F > y | v1 , v 2 ) = , calcule, usando a Tabela 7: a) F ( 2, 3, 5%) b) F ( 3, 2, 95%) c) F (1, , 5%) d) F (120, 120, 5%) e) F (15, 15, 95%) f) F ( 28, 35, 5%)
07 - Da populao X : N(50,10) retirou-se uma amostra casual simples de n = 10 elementos. Da populao Y : N(60,10) retirou-se uma amostra casual simples de m = 6 indivduos,
2 independente da primeira. Obtemos as varincias amostrais S12 e S 2 , respectivamente.
S12 a) Encontre o valor de a tal que P 2 < a = 95% . S2 S2 b) Encontre o valor de b tal que P 12 > b = 95% . S2
Exerccios XIV - 2
Comecemos com um exemplo. Ex.: Determinado tipo de amplificador de isolao fabricado em Taiwan e possui um determinado parmetro, mxima temperatura de isolao, que em mdia vale 155
o
mercado americano. Caso haja uma falha durante o processo de fabricao com relao a tal parmetro, os amplificadores so vendidos no mercado paraguaio e possuem uma mxima temperatura mdia de 145oC com desvio padro 12oC. Uma certa indstria utiliza os amplificadores com as caractersticas americanas em seus equipamentos produzidos e deseja obter um grande lote desses amplificadores. Entretanto, existe alguma razo para se temer que esse lote possa ser formado por amplificadores com as caractersticas paraguaias, o que seria indesejvel. Os amplificadores americanos e paraguaios so indistingveis quanto aparncia e portanto o comprador resolve testar 25 deles, tomados aleatoriamente do lote, para tomar a deciso de compra.
A) Que regra de deciso devem usar os responsveis da indstria para dizer se os amplificadores so compatveis com o mercado americano ou paraguaio? Uma resposta que ocorre imediatamente a que considera como tipo de mercado aquele em que a mdia amostral ( X ) mais se aproxima da mdia populacional ( ). Assim
uma regra de deciso seria: Se X 150 (o ponto mdio entre 145 e 155), diremos que os amplificadores so
X
Isto pode ser visto como
145 150 155
Teste de Hipteses - 1
Se X = 148oC, por exemplo, de acordo com essa regra de deciso diramos que os
amplificadores so do tipo paraguaio. Poderamos, contudo estar enganados nesta deciso: H a probabilidade de que 25 amplificadores do tipo americano apresentem mdia amostral
X = 148o C .
Ento, para melhor entendermos a regra de deciso adotada, interessante estudarmos os tipos de erros que podemos cometer e as respectivas probabilidades de cometermos estes erros. Tais erros so descritos assim: Erro I - Dizer que os amplificadores so do tipo paraguaio quando na verdade so americanos. Isto ocorre quando uma amostra de 25 amplificadores do tipo americano apresenta mdia X 150C.
Erro II - Dizer que os amplificadores so do tipo americano quando na realidade so paraguaio. Isto ocorre quando uma amostra de 25 amplificadores paraguaios apresentam mdia X > 150C.
Vamos usar a seguinte notao para facilitar a linguagem: Ho: Os amplificadores so do tipo americano. Isso equivale a dizer que a temperatura X de cada amplificador segue uma distribuio com mdia
O Erro I pode ser entendido como o erro principal. Uma analogia pode ser aqui feita. Considere a importante afirmao: Uma pessoa considerada inocente at que se prove o contrrio, pois um erro muito mais grave condenar um inocente (Erro I) do que libertar um culpado (Erro II).
No nosso exemplo, definido o Erro I, podemos delimitar a regio de valores, em que poderemos cometer tal erro. Esta regio definida como regio crtica RC, dada nesse caso por:
RC = { y R / y 150}
Teste de Hipteses - 2
Com as anotaes anteriores a probabilidade de cometer cada um dos dois erros pode ser assim descrita:
P (Erro I) = P ( X RC | Ho verdadeira) = nvel de significncia e
P (Erro II) = P ( X RC | H1 verdadeira) =
Assim:
150 155 P( Erro I) = P ( X 150 | X : N (155 ; 4)) = P z 4 = P( z 125 = 10,5 % = . ) = 0105 .
ii) De modo anlogo, se H1 verdadeira, teremos:
12 X : N 145 ; ou X : N (145 ; 2.4) 25
Assim: 150 145 P( Erro II) = P ( X > 150 | X : N (145 ; 2.4)) = P z > 2.4 = P( z > 2.08) = 0.018 = 1,8 % = Observando estes dois resultados, notamos que, com a regra de deciso adotada, estaremos cometendo o Erro I com maior probabilidade do que o Erro II. De certo modo, esta regra de deciso privilegia a afirmao de que amplificadores so do tipo paraguaio. A tabela seguinte sintetiza tal regra de deciso:
Tipo de Amplificador
X Americano
Correta Erro I = 10,5 %
Teste de Hipteses - 3
145
150
155 = 1,8 %
150, os valores de e mudaro. Observe que se x c for menor que 150, diminui e
Do exposto anteriormente, constatamos que, escolhido um valor x c poderemos achar e . Mas tambm podemos proceder de modo inverso: fixar um dos erros, digamos , e encontrar a regra de deciso para tal erro. Por exemplo, fazendo = 5%, teremos: P( Erro I) = P ( X x c | X : N (155 ; 4)) = 5 % = P( Z 1645 . ) usando a transformao: Z =
X temos: n
1645 . =
x c 155 x c = 148.42 o C 4
Ento a regra de deciso ser: Se X for inferior 148.42, dizemos que o lote do tipo paraguaio; caso
contrrio, dizemos que americano, ao nvel de 5%. pode ser assim calculado:
Teste de Hipteses - 4
B) Suponhamos agora que devido a grande procura desses amplificadores, diversas pequenas indstrias resolvem investir na sua fabricao, tentando imitar ao mximo os amplificadores do tipo americano. Sabe-se contudo que nenhuma dessas imitaes consegue atingir para o parmetro, mxima temperatura de isolao, a mdia de 155oC. Qual a regra de deciso que deve agora adotar a indstria compradora?
A hiptese que nos interessa mais de perto nesse caso : Ho : Os amplificadores so do tipo americano (X : N (155 ; 20)). A hiptese alternativa muito mais ampla e pode ser expressa como: H1 : Os amplificadores no so do tipo americano ( < 155). Isso significa que s iremos desconfiar de Ho se X for muito menor do que 155.
Ou seja, a nossa regra de deciso dever ser semelhante vista anteriormente. Como os parmetros, alternativos so muitos, a melhor soluo para construir a regra de deciso fixar , a probabilidade de Erro I , ou seja, Erro I: Rejeitar Ho sendo Ho verdadeira. Fixando em 5%, por exemplo, teremos a seguinte regra de deciso: Se X for superior a 148.42 oC diremos que o lote do tipo americano; caso
contrrio, diremos que no , ao nvel de 5%.
Com essa regra de deciso e com a hiptese alternativa mais ampla, no podemos encontrar , pois no temos um nico parmetro como alternativa. Ento, aqui no podemos controlar o Erro II. A tabela e a figura seguinte expressam a regra de deciso adotada:
RC 148.42
X
Tipo de Amplificador Americano Correta Erro I =5% No Americ. Erro II =? No Americano Correta Americano
Deciso
Teste de Hipteses - 5
C) Admitamos agora que no exista razo alguma para acreditarmos que a mxima temperatura de isolao dos amplificadores, produzidos pelas indstrias concorrentes, seja menor do que os do tipo americano. Contudo, os compradores preferencialmente gostariam de ainda assim obter os amplificadores desse tipo. Qual regra deveria ser agora adotada?
Essa nova situao ir nos levar a duvidar de que no so do tipo americano, se a mdia observada for muito maior ou muito menor do que 155oC. Isto equivale s seguintes hipteses:
Ho: Os amplificadores so do tipo americano ( X : N (155; 20) ). H1: Os amplificadores no so do tipo americano ( 155 ).
Se X estiver entre
americano; caso contrrio, no so, ao nvel de %. Fixando , a probabilidade do Erro I, existiro muitos valores que satisfazem essa condio. A tabela e a figura seguintes esclarecem a regra de deciso para = 5%.
Teste de Hipteses - 6
RC
155
RC
147.16 Deciso
x c 1 = 147.16 155
x c 2 = 162.84
/2 onde:
P(Erro I) = P( X xc1 ou X > xc2 | X : N (155 ; 4)) = 5 %
xc2 155
4
Teste de Hipteses - 7
Exerccios XV
01- Para decidirmos se os habitantes de uma ilha so descendentes da civilizao A ou B, iremos proceder do seguinte modo: (i) selecionamos uma amostra de 100 moradores adultos da ilha, e determinamos a altura mdia deles; (ii) se essa altura mdia for superior a 176, diremos que so descendentes de B: caso contrrio, so descendentes de A. Os parmetros das alturas das duas civilizaes so: A : = 175 B : = 177 Definamos: Erro I e e = 10 = 10
Erro II - dizer que so de A quando, na realidade, so de B. a) Qual a probabilidade do Erro I? E do Erro II? b) Qual deve ser a regra de deciso se quisermos fixar a probabilidade do Erro I em 5%? Qual a probabilidade do Erro II, nesse caso? c) Se A = 5, como ficariam as respostas de (b)? d) Quais as probabilidades do Erro II, nas condies da questo (b), se a mdia B = 178? E B = 180? E B = 181? Coloque num grfico os pares (B, P(Erro II/B)). 02 - Fazendo o teste H0 : = 1.150 ( = 150), contra H1 : = 1.200 ( = 200),
b) Num jri, um indivduo est sendo julgado por crime. As hipteses sujeitas ao jri so: - o acusado inocente; - o acusado culpado. c) Um pesquisador acredita que descobriu uma vacina contra resfriado. Ele ir conduzir uma pesquisa de laboratrio para verificar a veracidade da afirmao. De acordo com o resultado, ele lanar ou no a vacina no mercado. As hipteses que pode testar so: - a vacina boa; - a vacina no boa. 04 - Se, ao lanarmos trs vezes uma moeda, aparecem 3 coroas, decidimos rejeitar a hiptese de que a moeda honesta. Quais as probabilidades de Erro I e Erro II? 05 - A varivel X, custo de manuteno de um tear, pode ser considerada como tendo distribuio normal e mdia podem ser 200 ou 210. Para verificar qual dos dois valores o mais provvel, usar-se- uma amostra de 25 teares. Defina: a) uma hiptese a ser testada; b) uma regra de deciso e encontre as probabilidades dos erros de tipo I e II.
Exerccios XV - 2
A construo de um teste de hiptese, para um parmetro populacional, pode ser colocada do seguinte modo. Existe uma v.a. X em cada populao. Tem-se uma hiptese sobre determinado parmetro dessa populao. Por exemplo, afirmamos que esse valor um nmero o. Colhe-se uma amostra aleatria de elementos dessa populao, e atravs dela deseja-se comprovar ou refutar tal hiptese. Como j vimos anteriormente, iniciamos explicitando claramente qual a hiptese que estamos colocando prova, e a chamamos de Hiptese nula Ho. No nosso caso: Ho : = o Em seguida convm explicitar tambm a hiptese alternativa H1, que ser considerada como aceitvel, caso Ho seja rejeitada. A caracterizao estatstica de H1 ser dada por: H1 : o H1 : > o H1 : < o (teste bilateral), ou (teste unilateral), ou (teste unilateral),
Qualquer que seja a deciso tomada, j vimos que estamos sujeitos a cometer erros. Tais erros so: Erro do Tipo I Rejeitar Ho sendo Ho verdadeira, com a seguinte probabilidade de ocorrncia: P (Erro I) = P (rejeitar Ho | Ho verdadeira) = Erro do Tipo II No rejeitar Ho sendo Ho falsa, com a seguinte probabilidade. P (Erro II) = P (no rejeitar Ho | Ho falsa) = $ obtida de uma O objetivo do teste de hiptese dizer, atravs de uma estatstica amostra, se Ho ou no aceitvel. Operacionalmente isso conseguido atravs da regio crtica RC. Tal regio construda em funo de . A determinao de j mais difcil e pode ser melhor compreendida pela Curva Caracterstica de Operao, que ser vista adiante.
Teste de Hipteses - 8
Uma seqncia lgica que pode ser usada sistematicamente para qualquer teste de hiptese dada a seguir. Sua implementao computadorizada tem sido freqentemente utilizada em forma de algoritmo: Primeiro passo: Definir Ho : = 0 e H1 $ Segundo passo: Escolher a Estatstica de teste adequada, Terceiro passo: Escolher e estabelecer RC Quarto passo: $ com base em uma amostra de tamanho n extrada da Calcular populao. Quinto passo: $ RC. No rejeitar Ho em caso contrrio. Rejeitar Ho caso
Ex.: Para o exemplo dos amplificadores americanos da seo anterior (caso B) teramos: X: N(155;20) X: N(<155;20) Tipo Americano Tipo No Americano
(Amplificadores so Americanos)
3o passo: = 5% z = -1.65
Teste unilateral
Teste de Hipteses - 9
N(155 ; 20/5)
RC = {y R | y < 148.42}
X
148.42 -1.65 155
4o passo: Clculo da mdia amostral com base nas 25 amostras 5o passo: Caso a mdia amostral pertena regio crtica, rejeitamos Ho aceitamos H1
Algumas situaes de testes so mais freqentes do que outras. Assim, adiante, veremos exemplificados os seguintes testes:
1) Teste sobre a mdia de uma populao normal com varincia conhecida. 2) Teste sobre a proporo. 3) Teste sobre a mdia de uma populao normal com varincia desconhecida. 4) Teste sobre a varincia de uma populao normal. 5) Comparao das varincias de duas populaes normais. 6) Comparao de duas mdias de populaes normais, varincias iguais, desconhecidas. 7) Comparao de duas mdias de populaes normais, varincias desiguais, desconhecidas. 8) Observaes emparelhadas. 9) Teste de independncia. 10) Teste sobre coeficiente de correlao
Teste de Hipteses - 10
Vimos que, na construo do teste de hipteses, procuramos controlar o Erro I, fixando , a sua probabilidade de ocorrncia . Fixado esse nmero, a regio crtica construda de modo que
$ RC | H verdadeira) = P ( o
J a probabilidade do Erro II, , na maioria dos casos no possvel calcular, pois usualmente a hiptese alternativa no especifica uma nica possibilidade, mas uma famlia de possibilidades alternativas. Temos para o Erro II que
$ RC | H verdadeira) = ou P ( 1 $ RC | H verdadeira) = P ( 1
Assim: RC = { y R | y > 206.6 } e a nossa regra de deciso ser: Se X RC , o custo de manuteno superior a 200, caso contrrio, no . A figura seguinte ilustra esse processo.
Teste de Hipteses - 11
=5%
200 RC
206.6 RC
Vamos supor que, em realidade, a hiptese testada Ho seja falsa. A probabilidade do Erro II, no pode ser calculada, a menos que se especifique um valor alternativo para . Por exemplo, se = 204, a mdia X de 25 teares ter distribuio. X : N (204, 4) portanto, = P ( X RC | = 204) = 74,21%
xc n 206.6 204 = 0.65 = 74.21% 4
pois:
z=
N(204,4) N(200,4)
200 = 74,21 %
206.6 =5%
1.0 0.95 0.8 74.21 0.6 0.4 0.2 0 200 204 208
Tal curva denominada Curva Caracterstica de Operao (C.C.O.) deste teste . (H1 : > 200, = 5%, conhecido). Genericamente a Curva Caracterstica de Operao costuma ser dada, para fixo, em funo da distncia - o padronizada, isto , medida em termos do desvio padro da populao, ou seja, designando por d essa distncia padronizada, temos:
H1 : > 0 ou ou H1 : < 0 H1 : 0 d= 0
d= d=
0
0
Em suma, o que se pretende quantificar o afastamento entre o valor real do parmetro ( alternativo) e o valor testado ( o). Com o intuito de tornar gerais as C.C.O., vamos tambm substituir pela probabilidade de aceitar Ho, qual designaremos por L (d) (Obs.: L(d)= ). Tal generalizao tem a vantagem de tornar a curva utilizvel, independentemente dos particulares valores de o ou , devido d ser padronizado Entretanto, devemos considerar ainda que a variao de (ou L (d)), depende, tambm, fundamentalmente, do tamanho da amostra n. Observando as curvas das figuras seguintes, notamos que o teste mais sensvel para os maiores valores de n (pequenas variaes em d acarretam grandes variaes em L (d)). Os testes mais sensveis devem ser
Teste de Hipteses - 13
preferidos. Este conceito est de acordo com a idia de que um teste com amostras maiores deve levar a resultados melhores.
L(d) C.C.O. H1 : > 0 ou H1 : < 0 (Teste unilateral) conhecido = 5%
d -1 0 1 2
C.C.O.
d 0 1 2
H1 : 0 conhecido = 5%
Teste de Hipteses - 14
H1 : 0 conhecido = 1%
Uma anlise dessas curvas mostra que, nas proximidades do valor testado (d = 0), a probabilidade de aceitao de Ho sempre muito alta , bastante prxima de 1 - . Logo se H1 for verdadeira, a gravidade do Erro II no relevante pois a diferena prtica entre a realidade e a hiptese testada seria pequena. A gravidade do Erro II se acentua medida que o verdadeiro valor do parmetro se afasta do valor testado pressuposto em H0. Nessas condies, aceitar H0 pode ser altamente indesejvel, mas para tais casos, tende a diminuir. Devemos, pois, estabelecer at que ponto uma divergncia entre a realidade e H0 pode ser tolerada. Seja esse ponto e d a distncia padronizada correspondente. Fixamos, ento, uma probabilidade mxima de se cometer o Erro II se d d , caso em que esse erro causa preocupao. Com d e , caracterizamos um ponto no grfico das CCOs. A curva que passa por esse ponto define o tamanho da amostra necessria realizao do teste com ,
e d fixados.
As CCOs indicam o poder discriminatrio dos testes. Assim, pela anlise de suas figuras, vimos que, quanto maior a amostra, mais factvel ser distinguirmos, com probabilidade de erro fixada, uma pequena diferena entre o valor real do parmetro e o valor testado. Graficamente, as curvas que correspondem aos testes mais poderosos so as que apresentam maior inclinao.
Ex.: Para um caso em que a carga mdia de ruptura especificada para certos
parafusos seja de 50kg, sendo o desvio padro dessas cargas igual a 4kg, suponhamos que um comprador especifique tambm que: a) se o lote satisfaz especificao, o comprador deseja limitar a 5% a Teste de Hipteses - 15
probabilidade de concluir que o lote insatisfatrio; b) se o lote tiver uma resistncia mdia ligeiramente menor que 50kg, tal fato no causa preocupao, porm deseja-se que, se a verdadeira resistncia mdia for inferior a 48kg, tal fato seja identificado com pelo menos 90% de probabilidade. Nessas condies, qual o tamanho da amostra mnima necessria e qual o limite da regio crtica?
Soluo: O teste a ser feito ser: H0 : = 50kg H0 : < 50kg sendo que as condies (a) e (b) indicam =5% e =10%, este associado a um d tal que: d'=
0 ' 50 48 = = 0.5 . 4
Entrando na CCO com esses valores, v-se que a amostra dever ter cerca de 35 elementos. Dimensionada a amostra, podemos, atravs do Teorema Central do Limite determinar o limite da regio crtica:
x1 = 0 z5%
= 50 1.645
4 35
48.89kg
Alternativamente s CCOs, expresses analticas para a determinao do tamanho da amostra podem ser tambm usadas.
Ex.: Derivemos uma dessas expresses. Sejam as hipteses
H0 : = 0 H0 : > 0 com conhecido e fixados , e . Conforme vimos, a fixao de >0 equivale a se admitir que, se o valor real do parmetro for, em verdade, superior a 0 , porm no ultrapassando , no nos importaremos em cometer o erro II, pois a aceitao de H0 em tais casos no trar consequncias considerveis. Se porm, tivermos, em realidade, <, desejaremos limitar a probabilidade de aceitar H0 nessas condies a um valor mximo fixado . Essa probabilidade ser associada ao ponto e, assim, garantimos que, se >, L(d) . Temos ento que, se = 0 , a probabilidade de se rejeitar H0 dever ser , e, se
Teste de Hipteses - 16
= , a probabilidade de se aceitar H0 dever ser . Admitindo-se que seja constante com , tal situao est mostrada na figura seguinte, onde x 2 o limite da regio crtica e as curvas apresentadas representam as distribuies amostrais de x se = 0 e se = .
x=/n1/2
x2
) 2 , onde d = (
' 0 ).
Essa expresso nos fornece o tamanho mnimo da amostra para satisfazer s condies impostas. evidente que a expresso de n pode ser utilizada indistintamente para testes unilaterais direita ou esquerda. Muitas outras dessas expresses podem ser obtidas de diferentes outros testes
Diversos autores preferem apresentar as C.C.O. sob a forma de Curvas de Poder do Teste, nas quais se plotam valores de 1 - L (d).em funo de d.
Programas de computador como o Statgraf fornecem essas curvas de uma maneira bastante simples.
Teste de Hipteses - 17
Exerccios XVI
01 - Suponha que estejamos testando H0 : p = 0,5 contra H1 : p 0,5 e que, para uma amostra de tamanho n = 10, decidimos pela regio crtica RC = {0, 1, 2, 8, 9, 10}. a) Determine o nvel de significncia x. b) Calcule a CCO do teste para p = 0,2, p = 0,4, p = 0,6 e p = 0,8. Faa um grfico da CCO c) Qual o poder do teste para p = 0,5? 02 - Sendo X o custo de manuteno de um tear, sabe-se que X : N(, 20). Para testar a hiptese H0 : = 200, contra a alternativa H1 : > 200, ser usada uma amostra de 25 teares. a) Fixando-se = 5%, encontre a correspondente RC. b) Atribuindo-se valores arbitrrios para , esboce a CCO do teste. c) Para que valores de , o poder ser maior do que 50%?
Exerccios XVI - 1
5.4.1 - Teste sobre a Mdia de uma Populao Normal com Varincia Conhecida
Ex.: A associao dos proprietrios de indstrias metalrgicas est muito preocupada com o tempo perdido com acidentes de trabalho, cuja mdia, nos ltimos anos, tem sido da ordem de 60 horas/homem por ano e desvio padro de 20 horas/homem. Tentouse um programa de preveno de acidentes e, aps o mesmo, tomou-se uma amostra de 9 indstrias e mediu-se o nmero de horas/homem perdidas por acidente, que foi de 50 horas. Voc diria, ao nvel de 5%, que h evidncias de melhoria? Calcule um intervalo de confiana de 95% para a mdia. Soluo: 1o passo: H0 : = 60 H1 : < 60 2o passo: X : N (60; 20) (No houve melhora) (Houve melhora)
20 X : N 60; 9
z= X n
3o passo: = 5% z = -1.65
Teste unilateral
N(60 ; 20/3)
RC = {y R | y < 49.03}
60
z
X = 50 (Das amostras)
No h evidncia, ao nvel de 5%, de que o programa tenha ocasionado melhoras. Clculo de IC ( : 95%):
P X z 2
n X + z 2
n = 1
IC ( :95%) = X z 2
n X + z 2
. ( 20 n = 50 196
) [
9 ) ; 50 + 196 . ( 20
9)
= [ 36.94 ; 63.07]
Ex.: a) Um industrial deseja certificar-se de que a frao de mercado que prefere seu produto ao de seu concorrente superior a 70%. Para tanto colheu uma amostra aleatria de 165 opinies, das quais 122 lhe foram favorveis. Pode o industrial ficar satisfeito com esse resultado, adotado o nvel de significncia de 5%?
Soluo:
$= p
x n
ou seja:
z=
( 0.7 ) ( 0.3 )
165
) = p$ : N ( 0.7; 0.036)
$ p $ 0.7 p = n 0.036
Teste de Hipteses - 19
3o passo: = 5%
0.7
0.759
z
1.65
4o passo: n = 165
x = 122
$= p
No h evidncia, ao nvel de 5%, de que a proporo seja superior a 70%. O industrial no deve ficar satisfeito a esse nvel.
(no caso, admitir que no tem mais de 70% do mercado) quando, em verdade, ele tem mais de 75%. Ele gostaria que a probabilidade de cometer esse erro no superasse 10%. Pergunta-se se a amostra utilizada seria suficiente para atender a essa exigncia e ao nvel de significncia adotado.
Soluo:
Aqui, o problema consiste em avaliar o erro para = 75%. Temos assim a seguinte situao:
Teste de Hipteses - 20
$ p
0.75
0.759 > 5%
$ c = 0.759 sendo maior que 0.75 implica em ocasionar um erro Observe que p
superior a 50%.
$ c seja reduzido. Isso Para diminuir ao limite de 10% deveremos fazer com que p
0.7
$ p c
$c 0.75 p
$ p
= 10%
> 5%
Para = 5%, fixo, devemos atuar na varincia, no intuito de conseguir = 10%. Isso alcanado aumentando-se o nmero de amostras n (e conseqentemente teremos uma diminuio em
p.q n
Teste de Hipteses - 21
N(0.7 ; ) N(0.75 ; )
$ p
0.7
pc
0.75 = 5%
= 10%
Logo, a amostra utilizada no suficiente para atender a exigncia proposta pelo problema.
5.4.3 - Teste sobre a Mdia de uma Populao Normal com Varincia Desconhecida
Ex.: Sempre que o aumento da temperatura da gua em uma cmara compressora superar 5 C, o processo de resfriamento deve ser recalibrado. Este processo , entretanto caro e portanto deve ser feito apenas se necessrio (adote um nvel de 5%). Em oito experimentos independentes com a cmara, obtiveram-se os seguintes aumentos mdios: 6.4 4.3 5.7 4.9 6.5 6.4 5.1 5.9
o
Soluo:a)
1o passo: Ho : = 5oC
H1 : > 5oC
t=
x s n
com
x =
s=
1 2 ( xi x ) n 1
e n - 1 graus de liberdade
Teste de Hipteses - 22
t0.05 , 7 5%
x
x = 5.65 s = 0.81
RC = {y R | y > 5.54}
5 0 4o passo: x = 5.65 C
5.54 t 1.895
RC , rejeitamos Ho
[4.97; 6.33 ]
Ex.: Uma das maneiras de manter sob controle a qualidade de um produto controlar a sua varincia. Uma mquina de encher pacotes de caf est regulada para enchlos com um desvio padro de 10g e mdia de 500g. O peso de cada pacote X segue uma distribuio normal. Colhendo-se uma amostra de 16 pacotes obtivemos uma varincia
s 2 = 169 g 2 .
Com esse resultado podemos dizer que a mquina est desregulada em relao varincia? (Considere = 5%).
Soluo:
1o passo: Ho : 2 = 100
Teste de Hipteses - 23
Ho : 2 > 100
( n 1) s
:2(v)
com s 2 =
1 2 ( xi x ) n 1
v = n - 1 graus de liberdade.
2 3o passo: =5%,n=16,v = n 1 = 15 0 , 05 = 24,99
(tabela)
24.99 = (15) S c2 S c = 166,6 100
5%
RC = {y R | y > 166,6}
s2
0 0 100 15 166,6
2
24.99
4o passo: s2 = 169 g2 5o passo: como s2 = 169 RC, rejeitamos Ho H evidncia de que, ao nvel de 5%, a mquina no esteja regulada.
Teste de Hipteses - 24
Exerccios XVII
01 - Sabe-se que o consumo mensal per capita de um determinado produto tem distribuio normal, com desvio padro de 2 kg. A diretoria de uma firma que fabrica esse produto resolveu que retiraria o produto da linha de produo se a mdia de consumo per capita fosse menor que 8 kg. Caso contrrio, continuaria a fabric-lo. Foi realizada uma pesquisa de mercado, tomando-se uma amostra de 25 indivduos, e verificou-se que
X
i =1
25
a) Construa um teste de hiptese adequado, utilizando = 0,05, e com base na amostra colhida determine a deciso a ser tomada pela diretoria. b) Qual a probabilidade de se tomar uma deciso errada se, na realidade, a mdia populacional = 7,8 kg? c) Se a diretoria tivesse fixado = 0,01, a deciso seria a mesma? (Justifique sua resposta). d) Se o desvio padro da populao fosse 4 kg, qual seria a deciso? (Justifique sua resposta). 02 - A associao dos proprietrios de indstrias metalrgicas est muito preocupada com o tempo perdido com acidentes de trabalho, cuja mdia, nos ltimos tempos, tem sido da ordem de 60 horas/homem por ano e desvio padro de 20 horas/homem. Tentou-se um programa de preveno de acidentes e, aps o mesmo, tomou-se uma amostra de 9 indstrias e mediu-se o nmero de horas/homem perdidas por acidente, que foi de 50 horas. Voc diria, ao nvel de 5%, que h evidncia de melhoria? 03 - O salrio mdio dos empregados das indstrias siderrgicas de 2,5 salrios mnimos, com um desvio padro de 0,5 salrios mnimos. Se uma firma particular emprega 49 empregados com um salrio mdio de 2,3 salrios mnimos, podemos afirmar que esta indstria paga salrios inferiores, ao nvel de 5%? 04 - Uma companhia de cigarros anuncia que o ndice mdio de nicotina dos cigarros que fabrica apresenta-se abaixo de 23 mg por cigarro. Um laboratrio realiza 6 anlises desse ndice, obtendo: 27, 24, 21, 25, 26, 22. Sabe-se que o ndice de nicotina se distribui normalmente, com varincia igual a 4,86 mg2. Pode-se aceitar, ao nvel de 10%, a afirmao do fabricante? Exerccios XVII - 1
05 - Uma pessoa gaba-se de adivinhar qual ser o resultado do lance de uma moeda, mas preciso que os presentes no o perturbem com pensamentos duvidosos. Para testar tal capacidade, lanou-se uma moeda perfeita 6 vezes, e o adivinhador acertou 5. Qual seria sua concluso? 06 - O consumidor de um certo produto acusou o fabricante, dizendo que mais de 20% das unidades fabricadas apresentam defeito. Para confirmar sua acusao, ele usou uma amostra de tamanho 50, onde 27% das peas eram defeituosas. Mostre como o fabricante poderia refutar a acusao. Utilize um nvel de significncia de 10%. 07 - Um fabricante garante que 90% dos equipamentos que fornece a uma fbrica esto de acordo com as especificaes exigidas. O exame de uma amostra de 200 peas desse equipamento revelou 25 defeituosas. Teste a afirmativa do fabricante, aos nveis de 5% e 1%. 08 - Os produtores de um programa de televiso pretendem modific-lo se for assistido regularmente por menos de um quarto dos possuidores de televiso. Uma pesquisa encomendada a uma empresa especializada mostrou que, de 400 famlias entrevistadas, 80 assistem ao programa regularmente. Baseado nos dados, qual deve ser a deciso dos produtores? 09 - Suponha que queiramos testar H0 : = 50, contra H1 : > 50, onde mdia de uma normal N(, 30). Extrada uma amostra de n = 36 elementos da populao, obtemos
x = 52 . Calcule o nvel descritivo do teste. 10 - Os novos operrios de uma empresa so treinados a operarem uma mquina, cujo tempo X (em horas) de aprendizado anotado. Observou-se que X segue de perto a distribuio N(25,10). Uma nova tcnica de ensino, que deve melhorar o tempo de aprendizado, foi testada em 16 novos empregados, os quais apresentaram 20,5 horas como tempo mdio de aprendizado. Usando o nvel descritivo, voc diria que a nova tcnica melhor que a anterior? 11 - A precipitao pluviomtrica anual numa certa regio tem desvio padro = 3,1 e mdia desconhecida. Para os ltimos 9 anos, foram obtidos os seguintes resultados: 30,5; 34,1; 27,9; 35,0; 26,9; 30,2; 28,3; 31,7; 25,8. a) Construa um teste de hipteses para saber se a mdia da precipitao pluviomtrica anual maior que 30,0 unidades. Utilize um nvel de significncia de 5%.
Exerccios XVII - 2
b) Discuta o mesmo problema, considerando desconhecido. c) Supondo que, na realidade, = 33,0, qual a probabilidade de tirarmos uma concluso errada? 12 - Supe-se que determinado tipo de indstria deva ter, em mdia, 30 empregados. Para testar tal hiptese, colhe-se uma amostra de 50 indstrias, cujo resultado est abaixo. Caso rejeite a hiptese, d um intervalo de confiana para a verdadeira mdia: (suponha que s 2 = 2 ) No de Empregados 25 35 35 45 45 55 55 65 65 75 Freqncia 8 10 13 10 9
13 - Uma fbrica de automveis anuncia que seus carros consomem, em mdia, 11 litros por 100 km, com desvio padro de 0,8 litros. Uma revista resolve testar esta afirmao e analisa 35 automveis dessa marca, obtendo 11,3 litros por 100 km como consumo mdio (considerar distribuio normal). o que a revista pode concluir sobre o anncio da fbrica, ao nvel de 10%? 14 - Um dos maiores problemas de uma grande rede de vendas a varejo verificar a adequao do estoque declarado com o real existente. Decidiu-se fazer a verificao atravs de procedimentos amostrais. Indicando por X o total em unidades monetrias de cada produto em estoque, verificou-se que X : N(, 20). Sero sorteados 4 produtos. O total X de cada um ser verificado e calcular-se- a mdia X , que ser a estatstica de deciso. Numa determinada filial, o valor declarado de 50. Havendo falta, este parmetro deve ser 45; no caso de excesso, 58. a) Defina H0 e H1. b) Descreva os erros do tipo I e II. c) Fixando = 10%, qual a regra de deciso para julgar se o estoque est correto ou no? d) Calcule o erro . e) Qual o significado de e neste problema? Exerccios XVII - 3
15 - Duas mquinas, A e B, so usadas para empacotar p de caf. A experincia passada garante que o desvio padro para ambas de 10 g. Porm suspeita-se de que elas tm mdias diferentes. Para verificar, sortearam-se duas amostras: uma com 25 pacotes da mquina A e outra com 16 pacotes da mquina B. As mdias foram, respectivamente,
Obs.: Para facilitar os clculos, informamos que a soma das observaes 13.500, e a
soma dos quadrados das observaes 22.335.650 (13.5002 = 182.250.000). a) Mostre que o teste de hiptese usado levar a aceitao de que a mdia das cidades pequenas igual do estado. b) Voc no acha estranha essa concluso quando observa que a mdia da amostra obtida bem maior do que a mdia do estado? Como voc explicaria isso? 21 - Deseja-se estimar qual a porcentagem mdia da receita familiar gasta com alimentao pelos moradores de uma grande vila industrial. Para isso, selecionou-se uma amostra de 16 famlias, que apresentou os seguintes resultados: 41 38 44 62 35 29 42 63 34 38 22 45 42 48 42 40
a) D um IC de 95% para a porcentagem mdia de todas as famlias de moradores da vila. b) Que suposio voc faz para responder a pergunta anterior? 22 - Observou-se a produo mensal de uma indstria durante vrios anos, verificando-se que ela obedecia a uma distribuio normal, com varincia 300. Foi adotada uma nova tcnica de produo e, durante 24 meses, observou-se a produo mensal. Aps esse perodo, constatou-se que X = 10.000 e s2 = 400. H razes para se acreditar que a varincia mudou, ao nvel de 20%? 23 - Numa linha de produo, muito importante que o tempo gasto numa determinada operao no varie muito de empregado para empregado. Que parmetro estatstico poderia ser usado para avaliar esse fato? Por qu? Se 11 empregados apresentam os tempos abaixo para realizar essa operao, qual seria a estimativa para o parmetro acima? 125 125 135 145 115 125 120 140 150 130 130
24 - Usando os dados do problema 23, verifique se tambm houve mudana de varincia do processo antigo para o novo.
Exerccios XVII - 5
Ex.: A tabela seguinte sintetiza medidas de corrente eltrica (em mA) obtidas por dois engenheiros na anlise de placas de circuito integrado. I: II: 35 32 35 34 37 34 33 31 31 32 33
Soluo:
2 2 1o passo: H0 = 2 I = II =
2 H1 = 2 I II
2o passo: Uso da estatstica F (Fisher/Snedecor- Ver) 3o passo: = 10%, nI = 6 (vI = 5), nII = 5 (vII = 4), teste bilateral.
P F ( 5,4 ) > f 0I = 5% f 0I = 6.26
1 1 P F (5,4 ) < f 0II = 5% , P < f 0II = 5% , P F ( 4,5) > = 5% f 0II F ( 4,5)
F ( v I , v II )
5%
5% S I2 F ( v I , v II ) = 2 S II
f0 II = 0.193
4 o passo: S I2 = 4.4
2 . S II = 18
f0 I = 6.26
S I2 F = 2 = 2.44 S II
Teste de Hipteses - 25
5o passo: Como F = 2.44 RC, no rejeitamos H0 No h evidncia ao nvel de 10% de que as varincias sejam diferentes, logo, h uma mesma homogeneidade.
1 1 X i e S x2 = ( X i X )2 , n n 1
1 1 2 = Xi e Sy (Yi Y )2 . m m 1
Conseqentemente:
Z= D D ( X Y ) ( x y ) = N ( 0 ;1) 2 D 2 y x + n m
Ex.: No exemplo anterior, nas medidas de corrente eltrica dos dois engenheiros, tnhamos: I: 35 35 34 37 34 33 31 31 32 33
II: 32
Uma outra questo: H evidncia para se afirmar, ao nvel de 5%, que a mdia maior no conjunto de medidas do engenheiro I?
Soluo:
ou
H 0 : D = 0 H1 : D > 0
com D = I II
Teste de Hipteses - 26
Z=
D D
( X I X II ) ( I II )
I2
n
2 II
m
2 ( n 1)S I2 + ( m 1)S II n+ m2
2 2 2 Fazendo 2 I = 2 = = S p =
t=
(X
X II ) ( I II ) Sp 1 1 + n m
t ,n + m 2
S p = 18 .
. = 1833 DC 0 DC = 1997 . 1 1 . + 18 6 5
D
1.997 t 1.833 4o passo: Das amostras,
D = X I X II = 34 32.6 = 14 .
. RC , no rejeitamos Ho 5o passo: Como D = 14
No h evidncia, ao nvel de 5% de que as mdias sejam diferentes.
Teste de Hipteses - 27
Ex.: Em uma experincia industrial, foi executado um trabalho por 10 operrios, de acordo com o mtodo I, e por 20 operrios, de acordo com o mtodo II. Os resultados levaram aos seguintes dados sobre a durao mdia e variabilidade do tempo, necessrios execuo do trabalho: Mtodo I: Mtodo II:
x I = 53 min x II = 57 min S I = 6 min S II = 15 min
Os dados permitem afirmar, ao nvel de 5%, que o mtodo I fornece um tempo mdio menor que o mtodo II?
Soluo:
2 H1: 2 I II
concluimos que H1 verdadeira . A partir desse resultado podemos efetuar o seguinte teste das mdias: 1o passo: H0 : I = II
H 0 : D = 0
ou
H1: I < II
2o passo: Uso da estatstica
H1: D < 0
D = I II
D D ( X I YII ) ( I II ) = D 2 2 I + II n m S2 Fazendo 2 ~ Z=
I I 2 ~ SII 2 II
temos t =
(X
X II ) ( I II ) ~ t ; v 2 S I2 S II + n m
2
2 S I2 S II n + m 2 com v = 2 2 2 2 SI S II n + m n 1 m 1
Teste de Hipteses - 28
SI2 = 36
2 SII = 225
1706 = .
DC 0 36 225 + 10 20
DC = -6.57
-6.57
t
-1.706 4o passo: D = X I X II = 4
5o passo: Como D RC , no rejeitamos Ho No h evidncia, ao nvel de 5%, de que a mdia do mtodo I seja menor do que a mdia do mtodo II.
Ex.: Uma empresa deseja estudar o efeito de uma pausa de 10 minutos para um cafezinho sobre a produtividade de seus trabalhadores. Para isso, sorteou 6 operrios e contou o nmero de peas produzidas durante uma semana sem intervalo e uma semana com intervalo. Operrio Sem Intervalo Com Intervalo 1 23 28 2 35 38 3 29 29 4 33 37 5 43 42 6 32 30
Soluo:
1o passo: H 0 : s = c
H 0 : D = 0
ou
H1: s < c
2o passo: Uso da estatstica t =
H1: D < 0
D = s c
D D pois SD n
D = X S X C = 325 . 34 = 15 .
S D = 2.88
2.015 =
DC 0 2.88 6
, DC = 2.37
RC = {y R | y < -2.37} 5%
D
-2.37 -1.476 0
t
0
Teste de Hipteses - 30
Teste de Hipteses - 31
Exerccios XVIII
01 - Uma das maneiras de medir o grau de satisfao dos empregados de uma mesma categoria quanto poltica salarial atravs do desvio padro de seus salrios. A fbrica A diz ser mais coerente na poltica salarial do que a fbrica B. Para verificar essa afirmao, sorteou-se uma amostra de 10 funcionrios no especializados de A, e 15 de B, obtendo-se os desvios padres sA = 1,0 SM e sB = 1,6 SM. Qual seria a sua concluso? 02 - Deseja-se comparar a qualidade de um produto produzido por duas fbricas. esta qualidade ser definida pela uniformidade com que produzido o produto por cada fbrica. Tomaram-se duas amostras, uma de cada fbrica, medindo-se o comprimento dos produtos ( o resumo dos resultados est no quadro abaixo). A qualidade das duas fbricas a mesma? Caso sua resposta seja negativa, d um intervalo de confiana para indicar a intensidade dessa desigualdade. Estatsticas Amostra Mdia Varincia Fbrica A 21 21,15 0,0412 Fbrica B 17 21,12 0,1734
03 - Num estudo comparativo do tempo mdio de adaptao, numa amostra aleatria, de 50 homens e 50 mulheres de um grande complexo industrial, produziu os seguintes resultados: Estatsticas Mdias Desvios padres Homens 3,2 anos 0,8 anos Mulheres 3,7 anos 0,9 anos
Que concluses voc poderia tirar para a populao de homens e mulheres desta indstria? (Indique as suposies feitas para resolver o problema) 04 - Diversas polticas em relao s filiais de uma rede de supermercados esto associadas ao gasto mdio dos clientes em cada compra. Deseja-se comparar esse parmetro para duas novas filiais, atravs de duas amostras de 50 clientes cada. As mdias obtidas foram 62 e 71, respectivamente. Sabe-se que o desvio padro, em ambos os casos, deve ser da ordem de 20 unidades. possvel afirmar que o gasto mdio das duas filiais o mesmo? Caso no seja, d um intervalo de confiana para a diferena. Exerccios XVIII - 1
05 - Uma fbrica de embalagens para produtos qumicos est estudando dois processos para combater a corroso de suas latas especiais. Para verificar o efeito dos tratamentos, foram usadas amostras cujos resultados esto no quadro abaixo. Qual seria a concluso sobre os dois tratamentos? Mtodo A B Amostra 15 12 Mdia 48 52 Desvio Padro 10 15
06 - No problema 02, teste a hiptese de que as mdias dos comprimentos do produto produzido pelas duas fbricas so iguais. 07 - Para investigar a influncia da opo profissional sobre o salrio inicial de recmformados, investigaram-se dois grupos de profissionais: um de liberais em geral e outro de formados em Administrao de Empresas. Com os resultados abaixo, expressos em salrios mnimos, quais seriam suas concluses? Liberais Administradores 6,6 8,1 10,3 9,8 10,8 8,7 12,9 10,0 9,2 10,2 12,3 10,8 7,0 8,2 8,7 10,1
08 - Para verificar a importncia de um determinado cartaz nas compras de certos produto, procedeu-se do seguinte modo: a) formaram-se 7 pares de lojas; b) os pares foram formados de modo que tivessem as mesmas caractersticas quanto localizao, ao tamanho e ao volume de vendas; c) num dos elementos do par, colocou-se o cartaz; no outro no; d) as vendas semanais foram registradas, e os resultados esto abaixo Qual seria sua concluso sobre a eficincia do cartaz? par 1 2 18 24 3 14 18 4 16 14 5 19 26 6 12 17 7 22 29
Exerccios XVIII - 2
Ex.: A tabela seguinte representa a distribuio conjunta das propores em relao aos totais de cada linha, associando tipo de cooperativa ao fator regional (veja Captulo 1, Coeficiente de Contingncia).
Tipo de Cooperativa Estado So Paulo Paran Rio G. do Sul Total Consumidor 214 (33%) 51 (17%) 111 (18%) 376 (24%) Produtor 237 (37%) 102 (34%) 304 (51%) 643 (42%) Escola 78 (12%) 126 (42%) 139 (23%) 343 (22%) Outros 119 (18%) 22 (7%) 48 (8%) 189 (12%) Total 648 (100%) 301 (100%) 602 (100%) 1551 (100%)
Os dados evidenciam dependncia entre os fatores: tipo de cooperativa e regio de localizao? (use = 5%) Soluo: 1o passo: H0: pij = ( pi )( p j ) (valor independncia)
H1: pij ( pi )( p j ) (valor observadovalor esperado dependncia)
observado
valor
esperado
Obs.: Recorde-se que: Pi j a probabilidade de um indivduo pertencer casa (i, j), Pi e P j so as probabilidades marginais. Assim, temos: Pi j = 33%,17%,...,8% Pi = 24%, 42%, 22% e 12% P j = 100%
Teste de Hipteses - 31
X 2 =
i =1 j =1
(o
i j
ei j ei j
2 2 : ,v
sendo:
m = nmero de linhas n = nmero de colunas v = (m - 1)(n - 1) oi j valor observado ei j valor esperado 2,v
X2 2c Obs.: O teste aqui ser sempre unilateral, a despeito do sinal em H0 ( Na verdade est se testando se X2 =0 ou X2>0 )
2 3o passo: = 5% m = 3, n = 4, v = 6 5 , 6 = 12.592
5%
5.6.2 - Teste sobre Coeficiente de Correlao Caso 1) =0 Ex.: Verificar se podemos, ao nvel de 5% de significncia, concluir pela existncia de correlao positiva entre a tenso na sada de um determinado gerador (em V) e a rotao de um mecanismo acoplado ao seu eixo (em Hz). Tenso: 174 Rotao: 73 Soluo: 1o passo: H 0 : ( X , Y ) = 0
H 1: ( X , Y ) > 0
161 66
170 64
180 94
182 79
164 72
156 62
168 64
176 90
175 81
onde: X Tenso Y Rotao 2o passo: Este teste pode ser feito atravs da quantidade
T=r
n2 :t 1 r 2 ,v
n nmero de amostras
onde: r = corr(X,Y) e
associada distribuio de Student com v = n - 2 graus de liberdade. 3o passo: = 5%, n = 10, v = 8, t5% , 8 = 1.86
t5%, 8
RC = {y R | y > 1.86}
5%
1.86
r=
1 X i X Yi Y ~ 0.772 n Sx Sy
8 = 3.435 1 (0.772) 2
T = 0.772
Teste de Hipteses - 33
5o passo: Como T R C , rejeitamos Ho H evidncia, ao nvel de 5%, de correlao positiva entre a tenso do gerador e a rotao do mecanismo.
Caso 2) = 0
Ex.: Durante muito tempo, o coeficiente de correlao entre a nota final num curso de treinamento de operrios e sua produtividade, aps 6 meses do curso, foi de 0,50. Foram introduzidas modificaes no curso, com o intuito de aumentar a correlao. Se o coeficiente de correlao de uma amostra de 28 operrios submetidos ao novo curso foi de 0,65, voc diria que os objetivos da modificao foram atingidos?
Soluo:
1o passo: H 0 : ( X , Y ) = 0.50
H 1: ( X , Y ) > 0.50
onde: X Resultado do teste Y Produtividade 2o passo: Fisher, estudando a distribuio amostral de r, descobriu que a estatstica
Z= 1 1+ r ln 2 1 r
Z = ln
1 2
1+ 0 1 , 2 e 0 parmetro populacional. Z = 1 0 n 3
Obs.: 1 e 0
3o passo: = 5%
Z = 2 Z = 1 1 + 0.5 ln = 0.549 2 1 0.5 1 = 0.04 28 3 Z = 0.2
logo: Z: N ( 0.549 ; 0.2 ) Relacionando normal reduzida N(0,1) com = 5% , temos que
Z= ZC Z 0.549 , , 1654 . = C 0.2
Z C = 0.878
Teste de Hipteses - 34
5o passo: Como z 0 RC , no rejeitamos Ho No h evidncia, ao nvel de 5%, de que tenha aumentado o coeficiente de correlao.
Teste de Hipteses - 35
Exerccios XIX
01 - Investigando a fidelidade de consumidores de um produto, obteve-se uma amostra de 200 homens e 200 mulheres. Foram classificados como tendo alto grau de fidelidade 100 homens e 120 mulheres. Os dados fornecem evidncia de possveis diferenas de grau de fidelidade entre sexos? 02 - Uma pesquisa sobre a qualidade de certo produto foi realizada enviando-se questionrios a donas-de-casa atravs do correio. Aventando-se a possibilidade de que os respondentes voluntrios tenham um particular vcio de respostas, fizeram-se mais duas tentativas com os no-respondentes. Os resultados esto indicados abaixo. Voc acha que existe relao entre a resposta e o nmero de tentativas? Opinio sobre o produto Excelente Satisfatrio Insatisfatrio No de donas-de-casa 1a tentativa 62 84 24 2a tentativa 36 42 22 3a tentativa 12 14 24
03 - Estamos estudando se h ou no correlao entre as notas de diversas disciplinas de um curso de mestrado. Analisando uma amostra de 12 alunos, encontrou-se uma correlao de 0,60 entre as disciplinas de Estatstica e Metodologia da Pesquisa. Teste a hiptese de no haver correlao entre as disciplinas. Caso a rejeite, d um intervalo de confiana para o coeficiente de correlao populacional. 04 - Existe relao entre o volume de uma carga e o tempo gasto para acondicion-la? Para investigar este fato, sortearam-se 9 pedidos de mercadorias, medindo-se as duas variveis de interesse. Com os dados obtidos abaixo, quais seriam suas concluses? Tempo Volume 84 48 108 72 110 63 133 82 144 88 152 109 180 112 196 123 231 140
Exerccios XIX - 1
CAPTULO 6 - AMOSTRAGEM
O texto que se segue , a menos de pequenas adaptaes, traduo de um texto clssico de William G.Cochran, estatstico com contribuies fundamentais Teoria da Amostragem.
Como preliminar para uma discusso do papel que a teoria desempenha em uma pesquisa por amostragem, interessante descrever sucintamente os estgios envolvidos no planejamento e execuo de uma pesquisa. As pesquisas variam grandemente em sua complexidade. Extrair uma amostra de um conjunto de 5.000 fichas numeradas e ordenadas em um arquivo uma tarefa simples. Muito diferente a extrao de uma amostra dos habitantes da regio amaznica, onde o transporte principal fluvial e atravs de florestas e os habitantes olham com desconfiana qualquer estranho que comece a fazer perguntas. Problemas srios em uma pesquisa podem ser triviais, ou mesmo no existir, em outras. Os principais estgios de uma pesquisa acham-se grupados - de forma um tanto arbitrria - em 11 tpicos. 1o. Objetivos da pesquisa Os objetivos da pesquisa devem ser claramente definidos. Sem isto, fcil, numa pesquisa complexa, esquecer os objetivos, perdidos nos detalhes do planejamento, e tomar decises em desacordo com os objetivos. 2o. Populao a ser submetida a amostragem A palavra populao denota o conjunto do qual se extrai a amostra. A definio da populao pode no apresentar problemas, como no caso de um lote de lmpadas, para determinar a vida mdia de uma lmpada. Por outro lado, ao extrairmos uma amostra de um conjunto de fazendas, devemos definir claramente o que entendemos por fazenda, e atentar para os casos extremos. Essas regras de definio devem ser usadas na prtica: o pesquisador deve ser capaz de decidir, no campo, sem muita hesitao, se determinado caso pertence ou no populao. Amostragem - 1
A populao a ser submetida a amostragem deve coincidir com a populao a cujo respeito desejamos informao (populao alvo). s vezes, por motivos prticos ou de convenincia, a populao sob amostragem mais restrita do que a populao alvo. Em tais circunstncias, cabe observar que as concluses extradas da amostra se aplicam populao sob amostragem. Para julgar se tais concluses podem ser estendidas populao alvo, so necessrias outras fontes de informao. Sero teis quaisquer informaes que se possam obter sobre as diferenas entre a populao submetida a amostragem e a populao alvo. 3o. Dados a serem coletados Convm verificar que todos os dados coletados sejam relevantes para a finalidade da pesquisa e que nenhum dado essencial seja omitido. H uma tendncia freqente, sobretudo com populaes humanas, de formular um nmero demasiadamente grande de questes, algumas das quais no chegam sequer a ser analisadas subseqentemente. Um questionrio muito extenso reduz a qualidade das respostas, tanto a questes importantes como a questes secundrias. 4o. Grau de preciso desejado Os resultados de pesquisas por amostragem esto sempre sujeitos a certo grau de inconfiana, no s porque se estudou apenas uma parte da populao, mas tambm em decorrncia de erros de mensurao. Esta inconfiana pode ser reduzida aumentando-se o tamanho da amostra e utilizando-se instrumentos mais precisos de mensurao. Mas isto em geral exige tempo e custa dinheiro. Conseqentemente, importante especificar o grau de preciso exigido nos resultados. Isto de responsabilidade da pessoa que vai usar os dados, e pode apresentar dificuldades, pois muitos administradores no esto acostumados a pensar em termos do valor do erro que pode ser tolerado em estimativas, consistente com a tomada de uma boa deciso. O estatstico pode prestar bom auxlio nesta fase. 5o. Mtodos de mensurao H mais de uma escolha do aparato de mensurao e da forma de abordar a populao. Dados sobre o estado de sade da pessoa podem ser obtidos da declarao pessoal ou de relatrio do exame mdico. A pesquisa pode utilizar um questionrio auto administrado, um entrevistador que l um conjunto de questes sem qualquer discrio, ou um processo de entrevista que deixa margem ampla quanto forma e ordenao das questes. A abordagem pode ser postal, telefnica, pessoal ou uma combinao das trs. Amostragem - 2
Parte importante do trabalho preliminar a construo de formulrios onde se registraro as perguntas e as respostas. No caso de questionrios simples, as respostas podem s vezes ser pr-codificadas - isto , registradas de maneira que possam ser transferidas sem dificuldade para um arquivo de computador. De fato, para construir arquivos de dados adequados, necessrio visualizar a estrutura das tabelas finais de resumo, que sero usadas para tirar concluses. 6o. Sistemas de referncia Antes de selecionar a amostra, a populao deve ser dividida em partes, chamadas unidades de amostragem, ou simplesmente unidades. Estas unidades devem abranger toda a populao, sem qualquer superposio. Isto : cada elemento da populao deve pertencer a uma, e somente uma, unidade. s vezes, a unidade apropriada bvia, como no caso de uma populao de lmpadas. Outras vezes, pode haver escolha da unidade. Ao extrair uma amostra da populao de uma cidade, a unidade pode ser um indivduo, os membros de uma famlia, ou o conjunto de todas as pessoas que moram em um quarteiro. Na amostragem de uma safra agrcola, a unidade pode ser um campo, uma fazenda ou uma rea de terra de formato e dimenses nossa escolha.A construo desta lista de unidades de amostragem, chamada Sistema de Referncia, , em geral, um dos principais problemas prticos. Com base na experincia, os pesquisadores adotam uma atitude critica em relao a listas que tenham sido compostas rotineiramente para algum propsito. A despeito de afirmaes em contrrio, tais listas se revelam freqentemente incompletas, ou parcialmente ilegveis, ou ento apresentam duplicaes. Uma boa estrutura pode ser difcil de obter quando a populao especializada. 7o. Escolha da amostra H uma variedade de planos para a escolha da amostra. Para cada plano considerado, podem-se fazer estimativas do tamanho da amostra com base no conhecimento do grau de preciso desejado. Devem-se comparar os custos relativos e o tempo envolvidos em cada plano antes de se tomar uma deciso. 8o. O pr-teste til testar o questionrio e o mtodo de trabalho no campo de atividade, em uma escala reduzida. Isto quase sempre resulta em melhoria do questionrio e pode revelar outros problemas que seriam srios em uma escala maior, como, por exemplo, o fato do custo poder ser muito maior do que o esperado. Amostragem - 3
9o. Organizao do trabalho de campo Em pesquisas extensas defrontamo-nos com muitos problemas de carter administrativo. O pessoal deve receber treinamento nos objetivos da pesquisa e nos mtodos de mensurao a serem empregados, e seu trabalho deve ser supervisionado adequadamente. de grande valia um processo para verificao preliminar da qualidade dos resultados. Os planos devem prever a no-resposta, isto , a falha do entrevistador em obter informaes de determinadas unidades da amostra. 10o. Resumo e anlise dos dados O primeiro passo verificar o questionrio completo, visando a corrigir erros ou, ao menos, eliminar dados obviamente errneos. Tornam-se necessrias decises sobre o processo de clculo nos casos de omisso de respostas a certas questes, por parte dos entrevistados, ou de eliminao no processo de edio do questionrio. Aps isto, fazem-se os clculos que conduzem s estimativas. Pode haver diferentes mtodos de estimao para os mesmos dados. 11o. Informao ganha para futuras pesquisas Quanto mais informaes tivermos inicialmente sobre uma populao, mais fcil se torna planejar uma amostra que d estimativas precisas. Qualquer amostragem completada potencialmente um guia para futuras amostragens melhoradas nos dados que ela fornece sobre as mdias, os desvios padro e a natureza da variabilidade das mensuraes principais e o custo da obteno dos dados. A prtica da amostragem avana mais rapidamente quando se fazem provises para reunir e registrar informaes deste tipo. H outro aspecto importante em que qualquer amostra completada facilita a obteno de futuras amostras. As coisas nunca se comportam tal como foram planejadas em uma pesquisa complexa. O pesquisador arguto aprende a reconhecer erros de execuo e fazer com que eles no ocorram em pesquisas futuras.
Amostragem - 4
6.2 - Questionrios
1 o. Tipos de questes Dois tipos de questes so usualmente empregados na redao de questionrios: questes de mltipla escolha e questes de resposta aberta. As alternativas em uma questo de mltipla escolha devem ser claras, mutuamente excludentes e quando pedirem opinies, fornecer opes dos dois lados do assunto. Idealmente, as opes devem cobrir todas as respostas provveis. Se, entretanto, muitas alternativas so apresentadas, elas podem no ser suficientemente claras e confundir o respondente no momento de sua deciso. A grande desvantagem de questes de mltipla escolha que tendem a sugerir uma resposta, j que limita as respostas possveis, impedindo o respondente de dizer exatamente o que pensa. Este tipo de limitao no ocorre nas questes de resposta aberta, onde o entrevistado usa suas prprias palavras para responder pergunta. Uma pergunta deste tipo produz uma grande gama de respostas que devem ser classificadas em grupo homogneos antes que se possa fazer uma anlise estatstica. Esta classificao uma tarefa difcil quando o nmero de respostas a serem analisadas muito grande. Por isso, questes de resposta aberta so mais freqentemente empregadas em estudos pilotos ou nos estgios exploratrios, quando se procura determinar que tipos de resposta aparecero. Essas informaes so ento usadas na construo do questionrio a ser utilizado na obteno dos dados de um grupo maior. s vezes inevitvel misturar os dois tipos de pergunta, quando, por exemplo, colocamos a opo Outros e pedimos especificao. Se os dados forem analisados por computador, deve-se pensar na etapa da codificao ao redigir as perguntas. 2 o. Ordem das questes Um questionrio consiste em uma bateria de questes arranjadas em certa ordem. As primeiras questes so para estabelecer contato com o respondente e devem ser bem simples. Quando vrios tpicos esto envolvidos, deve-se completar um tpico antes de passar a outro. A ordem das questes freqentemente afeta as respostas dadas pelo respondente, j que as perguntas chamam a ateno do entrevistado para um conjunto de pensamentos e sentimentos, em cujo contexto as outras perguntas sero respondidas. Em pesquisa de mercado, por exemplo, questes que mencionam um produto especfico tendem a Amostragem - 5
viciar as perguntas que se seguem; conseqentemente, estas questes identificando produtos ou firmas devem ser colocadas no final, sempre que possvel. 3 o. Tipo de abordagem Muitas pessoas tendem a racionalizar ou exagerar suas respostas quando so questionadas diretamente sobre seus motivos, realizaes ou outros assuntos que envolvam seu prestgio ou auto-estima. Para se evitar a introduo de tendenciosidade nessas respostas, usa-se freqentemente uma abordagem indireta na elaborao de questes que envolvem prestgio. Por exemplo, ao invs de perguntar: Voc terminou o curso secundrio?, pode-se perguntar: Em que ano voc estava quando deixou de estudar? Na segunda pergunta tentase evitar constrangimento aos respondentes que no terminaram o curso secundrio. 4 o. Clareza nas perguntas Uma pergunta deve ter aproximadamente o mesmo sentido para todos os entrevistados; caso contrrio, os dados obtidos no tero grande utilidade. Termos com sentido dbio devem ser evitados. As perguntas devem ser simples. Nem todos os entrevistados entendero questes com enunciado complexo, originando, assim, resultados ruins. 5 o. No sugerir respostas Na formulao das perguntas deve-se evitar um tipo de redao como esta: Voc concorda em que esta bebida, sendo a melhor, deve custar mais caro? Esta pergunta sugere to obviamente uma resposta que praticamente intil. Algumas vezes, entretanto, difcil perceber que a redao de uma pergunta possa sugerir determinada resposta. 6 o. A necessidade do pr-teste Assim que um questionrio tenha sido redigido, deve ser testado em um estudo piloto. Esta fase fundamental para detectar dificuldades no observadas, como o lay out do questionrio, ordem e redao das perguntas, necessidade de instrues mais claras para os entrevistadores etc. Naturalmente, a correo dessas imprecises melhorar a qualidade do levantamento. 7 o. A prtica de pesquisas por amostragem O leitor deve convencer-se de que fundamental conhecer as caractersticas especficas da rea onde pretende participar de pesquisas por amostragem. O significado Amostragem - 6
especial de algumas palavras, os melhores locais e horrios para se fazer coleta de dados, o tipo de entrevistador so, entre outros, fatores importantes para o bom andamento do levantamento. S lendo literatura na rea especifica que se pode, entretanto, conhecer estes detalhes. Por exemplo, para coletar amostras de um minrio com vistas ao controle de algum componente indesejvel, existem formas j bastante testadas internacionalmente, consagradas mesmo em normas de operao (cf. ABNT: Associao Brasileira de Normas Tcnicas). No se pode iniciar um trabalho nesta rea sem um estudo detalhado deste material. O mesmo se aplica a pesquisas de origem-destino, tcnica muito usada no planejamento de trfego urbano. A forma de planejar uma pesquisa de opinio pblica uma das tecnologias mais valiosas de uma firma que vende pesquisas de mercado e de opinio. Cada firma reflete nelas sua experincia. Para grandes levantamentos, o planejamento do plano amostral e dos instrumentos de coleta exige o concurso de um profissional.
Dim. 26 Eixo 16
Dim. 19
Extrair, sem reposio, uma amostra aleatria de tamanho n = 5. Soluo: Partindo da coluna 3 na TNA, procuramos os cinco primeiros nmeros no superiores a 30, lendo os dois ltimos algarismos direita. Obtemos a amostra: Leitura na TNA 26 15 03 07 06 Dimetro 29 26 26 30 22 Amostragem - 7
Poderamos tambm tomar os cinco primeiros nmeros no superiores a 30 formados pelos dois primeiros algarismos esquerda. Obteramos a amostra: Leitura na TNA 27 25 08 03 19 Dimetro 18 18 31 26 16
Quando os elementos da populao esto divididos em grupos no superpostos, mais fcil e mais eficiente escolher, independentemente, uma amostra aleatria simples dentro de cada um destes grupos, os quais so chamados estratos. Esta forma de amostragem uma das mais utilizadas, j que a maioria das populaes tm estratos bem definidos: os homens e as mulheres; os alunos das escolas X, Y, Z; os operrios pertencentes s classes salariais 1, 2, 3, 4 etc. O mais comum utilizar-se a amostragem estratificada proporcional, que consiste em selecionar os elementos da amostra entre os vrios estratos, em nmero proporcional ao tamanho de cada um dos estratos. Em outras palavras, sejam:
N o nmero de elementos da populao L o nmero de estratos Ni o nmero de elementos do estrato i n o tamanho da amostra a ser selecionada. Note-se que: N = N1 + N2 + ... + NL Calcula-se a frao de amostragem dada por
f =
n N
nmero de elementos a serem sorteados em cada estrato ser: N1f, N2f, ..., Nkf
Ex.:Na execuo de uma rede eltrica, uma firma especializada utiliza eletrodutos de dois tipos: E e F. Em uma anlise do custo do material foram consideradas 30 faturas, Amostragem - 8
Eletroduto (estrato) E
01
02
03
04
05
06
Eletroduto (estrato) F
Fatura Preo (R$) Fatura (cont.) Preo (R$) Fatura (cont.) Preo (R$)
01
02
03
04
05
06
07
08
09
10
750 750 750 750 755 760 760 765 765 765 11 12 13 14 15 16 17 18 19 20
765 765 770 770 770 785 785 790 790 795 21 22 23 24
Extrair, sem reposio, uma amostra estratificada proporcional de tamanho n = 8. Soluo: f = 8/30 = 0,27 De cada estrato sero sorteadas respectivamente n1 e n2 unidades: n1 = ( 0,27) ( 6) = 1,62 2 n2 = ( 0,27) ( 24) = 6,48 6
Lendo os dois ltimos algarismos a partir do incio da quarta coluna da TNA, obtemos o resultado:
Extrato
E 01
F 20 03 18 17 24 12
Entre as vantagens da amostragem estratificada destacam-se: a) Os dados so geralmente mais homogneos dentro de cada estrato do que na Amostragem - 9
populao como um todo; b) O custo da coleta e anlise dos dados freqentemente menor nesse tipo de amostragem do administrativas; c) Podem-se obter estimativas separadas dos parmetros populacionais para cada estrato sem selecionar outra amostra e, portanto, sem custo adicional. que na aleatria simples, devido a convenincias
Uma amostra por conglomerado uma amostra aleatria simples na qual cada unidade de amostragem um grupo, ou conglomerado, de elementos. O primeiro passo para se usar este processo especificar conglomerados apropriados. Os elementos em um conglomerado devem ter caractersticas similares. Como regra geral, o nmero de elementos em um conglomerado deve ser pequeno em relao ao tamanho da populao, e o nmero de conglomerados, razoavelmente grande. Tanto no caso da amostragem estratificada como no da amostragem por conglomerado, a populao deve estar dividida em grupos. Na amostragem estratificada, entretanto, seleciona-se uma amostra aleatria simples dentro de cada grupo (estrato), enquanto que na amostragem por conglomerado selecionam-se amostras aleatrias simples de grupos, e todos os itens dentro dos grupos (conglomerados) selecionados faro parte da amostra. A amostragem por conglomerado recomendada quando: a) Ou no se tem um sistema de referncia listando todos os elementos da populao, ou a obteno dessa listagem dispendiosa; b) O custo da obteno de informaes cresce com o aumento da distncia entre os elementos.
Ex.:Supondo que se deseje estimar o rendimento mdio familiar em uma cidade grande, como deve ser escolhida a amostra? Soluo: A amostragem aleatria simples invivel, pois pressupe uma listagem de todas as famlias da cidade, o que praticamente impossvel de se obter. Amostragem - 10
A alternativa da amostragem estratificada tambm invivel, j que aqui tambm necessria uma listagem dos elementos por estrato. A melhor escolha amostragem por conglomerado. O sistema de referncia pode ser constitudo por todos os quarteires da cidade. cada quarteiro um conglomerado. Extrai-se uma amostra aleatria simples de quarteires e neles pesquisa-se a renda familiar em todas as casas.
Uma amostra sistemtica de tamanho n constituda dos elementos de ordem K, K + r, K + 2r, ..., onde K um inteiro escolhido aleatoriamente entre 1 e n e r o inteiro mais prximo da frao N/n. Por exemplo, se a populao tem 100 elementos e vamos escolher uma amostra de tamanho 6, K um inteiro escolhido aleatoriamente entre 1 e 6 e r = 100/6 = 16,6 = 17. Se K = 3, a amostra ser composta pelos seguintes elementos: 3 20 37 54 71 88.
Se o tamanho da populao desconhecido, no podemos determinar exatamente o valor de r. Escolheremos intuitivamente um valor razovel para r.
s vezes a amostragem sistemtica preferida amostragem aleatria simples, porque mais fcil de executar, estando portanto sujeita a erros, e proporciona mais informaes com menor custo. Ex.:Escolha a tcnica adequada para extrair uma amostra de 50 compradores de uma loja. Soluo: A amostragem aleatria simples no pode ser empregada neste caso, pois o entrevistador no pode determinar quais compradores sero includos na amostra, uma vez que no se conhece o tamanho N da populao, at que todos os compradores tenham ido loja. Assim, ele pode usar a amostragem sistemtica (digamos 1 em cada 20 compradores) at obter a amostra do tamanho desejado.
Este tpico apresenta alguma dificuldade tcnica e s um estatstico profissional, conhecedor dos detalhes da situao, poder calcular o tamanho da amostra necessria em uma pesquisa especfica. Limitar-nos-emos aqui a apresentar frmulas para clculo do tamanho da amostra em duas situaes simples, admitindo que ser usada a amostragem aleatria simples. Proporo Se a pergunta do tipo SIM-NO e queremos, com nvel (1 - ) de confiana, que a proporo estimada esteja, no mximo, a uma distncia d da proporo verdadeira, ou seja, se queremos que
$ d] = 1 P[ p p
o valor de n dado por
z z PQ d2
onde z = Z
Ex:Deve-se realizar uma pesquisa de opinio pblica para determinar a proporo de pessoas que sofreram leses em conseqncia de algum tipo de acidente de trnsito. Quantas pessoas devero ser ouvidas para que sejam satisfeitas as seguintes condies: d = 0,02, p = 10%, = 5%? Soluo:
P = 0,1 Q = 1 P = 0,9 d = 0,02 = 0,05 z = 1,96 z 2 PQ (1,96) 2 ( 0,1)( 0,9) = = 865 pessoas n= d2 ( 0,02) 2
Mdia
H dois casos a considerar: 1. Controlar o erro relativo da estimativa da mdia de uma caracterstica da populao, com nvel 1 - de confiana: ou seja, queremos
Amostragem - 12
y P r = 1 y
onde y = mdia amostral, = mdia populacional. Neste caso o valor de n dado por
zs n= ry
onde
z=z
Note-se a necessidade de estimativas preliminares dos parmetros, o que constitui mais uma razo para se fazer um estudo piloto.
P X d = 1
O valor de n dado por
z n = d
onde z = z
1
verdadeira.
Ex.:Com os dados do exemplo anterior, determinar n para d = 5, = 12. Soluo:
Amostragem - 13
Populaes finitas
As expresses anteriores so vlidas para populaes infinitas ou, na prtica, muito grandes. Para populaes finitas o tamanho da amostra dado por
n=
n0 n 1+ o N
onde n0 o valor obtido pelas expresses anteriores e N o tamanho da populao. Freqentemente, em populaes com pequeno nmero de indivduos, todos tero de ser includos na amostra.
Amostragem - 14
Captulo 7 - Regresso
Muitas vezes a posio dos pontos experimentais no diagrama de disperso sugere a existncia de uma relao funcional entre as duas variveis. Surge ento o problema de se determinar uma funo que exprima esse relacionamento. Esse o problema da regresso, conforme a denominao introduzida por Fisher e universalmente adotada. Assim, se os pontos experimentais se apresentarem como na figura seguinte admitiremos existir um relacionamento funcional entre os valores y e x, responsvel pelo aspecto do diagrama, e que explica grande parte da variao de y com x , ou vice-versa. Este relacionamento funcional corresponderia linha existente na figura, que seria a linha de regresso. Uma parcela da variao, entretanto, permanece em geral sem ser explicada, e ser atribuda ao acaso. Em outras palavras, admitimos existir uma funo que justifica, em mdia, a variao de uma das variveis com a outra. Na prtica, os pontos experimentais tero uma variao em torno da linha representativa dessa funo, devido existncia de uma variao aleatria adicional, que chamaremos de variao residual.
y
x
Linha de regresso
Essa funo de regresso, portanto, nos d o valor mdio de uma das variveis em funo da outra; por exemplo, (Y/x). Posto dessa forma, o problema que vamos examinar ser, dados os pontos experimentais, o de realizar uma induo quanto expresso Regresso - 1
matemtica da funo de regresso. Evidentemente, tudo se simplificar se a forma da linha de regresso for suposta conhecida. O problema, ento, se reduzir apenas estimao de seus parmetros. Esse caso ocorrer se existirem razes tericas que permitam saber de antemo qual o modelo que rege o comportamento de uma varivel em funo da outra. A lei de Hook, por exemplo, afirma que, dentro de certos limites, as deformaes de corpos metlicos variam linearmente com as tenses aplicadas. Na anlise de um experimento desse tipo, portanto, o modelo linear para a linha de regresso poderia ser adotado de incio. Pode tambm ocorrer o caso em que a forma da linha fica evidente da prpria anlise do diagrama de disperso. Caso a forma da linha de regresso no seja conhecida de antemo, ela dever ser inferida juntamente com seus parmetros. Teremos, ento, alm do problema de estimao dos parmetros do modelo da linha de regresso, a dificuldade adicional de especificar a forma do modelo. No estudo que segue, vamos admitir inicialmente que a forma da linha de regresso seja uma reta. Teremos ento o problema da regresso linear simples, que veremos a seguir ( O termo simples destina-se a frisar que temos apenas duas variveis.). Posteriormente, estudaremos a regresso polinomial, em que a forma da funo suposta um polinmio de grau superior a 1. Nos dois casos a idia e os princpios fundamentais sero os mesmos que discutiremos em seguida. Vamos tambm admitir que a varivel X seja suposta sem erro, ou seja, noaleatria, enquanto que a varivel Y apresenta uma parcela de variao residual, a qual responsvel pela disperso dos pontos experimentais em torno da linha de regresso. Essa suposio permite utilizar um modelo que simplifica a soluo do problema, e justificvel porque muitos casos prticos se aproximam dele. Na verdade, encontraremos, na prtica, muitos casos em que a varivel X pode ser medida com preciso muito maior do que Y, o que coloca o problema praticamente nas condies supostas. A situao descrita corresponde, muitas vezes, a experimentos em que os valores de X so pr-determinados ou pr-escolhidos pelo experimentador, j que a varivel X suposta no-aleatria. No entanto, os valores de Y, sendo aleatrios, no podem ser exatamente previstos, e sero determinados experimentalmente. Podemos, por exemplo, medir as temperaturas de um forno em aquecimento de 5 em 5 min., a partir de um instante 0. Ora, a menos de pequenas imprecises, totalmente desprezveis, os tempos (valores de X) esto bem determinados, ao passo que as temperaturas devero ser verificadas no decurso do Regresso - 2
experimento. Vemos que, neste exemplo, os valores de X independem dos de Y, pois foram simplesmente arbitrados, enquanto que os valores de Y dependero dos de X desde que exista regresso. Por essa razo, a varivel X dita varivel independente, enquanto Y dita varivel dependente. No caso da regresso mltipla, em que mais de duas variveis so envolvidas, obteremos uma equao para prever valores de uma varivel dependente em funo de duas ou mais variveis independentes. O modelo acima descrito, portanto, considera que os valores da varivel aleatria Y dependero do(s) valor(es) assumido(s) pela(s) varivel (is) independente(s) e tambm do acaso, isto , estaro sujeitos a uma variao aleatria que se sobrepe variao explicada pela funo de regresso. Isso pode ser expresso sob a forma. y = (x) + , onde denota a funo de regresso e a componente aleatria da variao de Y. No caso de regresso mltipla, x dever ser interpretado como um vetor de valores das variveis independentes. Ora, perfeitamente coerente com a idia contida no modelo admitir-se que a varivel aleatria tenha mdia 0, a fim de que toda a variao explicada de y fique concentrada em (x). Isso significa que a funo de regresso fornece a mdia de y para cada x considerado, conforme j mencionado. Uma outra suposio bsica que adotaremos no nosso estudo a de que a variao residual da varivel Y seja constante com X. Dito em outras palavras, isso significa admitir que a variao de Y em torno da linha terica de regresso pode ser descrita por um desviopadro residual que independe do ponto considerado. Por fim, admitiremos que a variao de Y em torno da linha terica de regresso se d segundo uma distribuio normal. Como a linha terica de regresso d os valores mdios de Y em funo de X, essa suposio implica considerar que a variao residual de Y seja normalmente distribuda com mdia zero e desvio-padro constante. Uma tentativa de representar graficamente essa situao feita na figura seguinte. Frise-se que a linha ali representada a linha terica de regresso, da qual obteremos uma estimativa a partir dos pontos experimentais.
Regresso - 3
Suponhamos ser a linha terica de regresso uma reta e que queiramos estabelecer a regresso de Y em funo de X. Logo, a funo que desejamos obter da forma
y = + x
x1
x2
x3
conveniente distino dos valores dados pela reta estimativa, das ordenadas dos pontos experimentalmente obtidos. Existem diversos mtodos para a obteno da reta desejada. O mais simples de todos, que podemos chamar de mtodo do ajuste visual, consiste simplesmente em traar diretamente a reta, com auxlio de uma rgua, no diagrama de disperso, procurando fazer, da melhor forma possvel, com que essa reta passe por entre os pontos. Esse procedimento, entretanto, somente ser razovel se a correlao linear for muito forte, caso contrrio levar a Regresso - 4
resultados subjetivos. Acima de tudo, ademais, merece a crtica de ser um procedimento nem um pouco cientfico. Por outro lado, a aplicao do princpio de mxima verossimilhana leva, nas condies admitidas, ao chamado procedimento de mnimos quadrados, segundo o qual a reta a ser adotada dever ser aquela que torna mnima a soma dos quadrados das distncias da reta aos pontos experimentais, medidas no sentido da variao aleatria. Ou seja, devemos
2 procurar a reta para a qual se consiga minimizar n i = 1 d i , sendo as distncias di as indicadas
na figura seguinte. A idia central desse procedimento simplesmente a de minimizar a variao residual em torno da reta estimativa.
y yi
$i y
xi
Os valores a e b que minimizam essa expresso sero aqueles que anulam as derivadas parciais dessa expresso. Ou seja, devemos ter
n n d2 = 0e d 2 = 0. i =1 i i =1 i a b
2i =1 ( y i a bx i ) = 0,
n n
2i =1 x i ( y i a bx i ) = 0,
Regresso - 5
Os pontos experimentais fornecem os elementos para a montagem desse sistema, cuja soluo forneceria os coeficientes a e b. Entretanto mais fcil considerar de uma vez a soluo analtica do sistema, a qual fornece
n (x i x ) y i S xy =1 i b = , = n 2 S xx ( ) x x i i =1 a = y bx ,
expresses que do diretamente os coeficientes a e b que desejvamos obter. Algumas vezes torna-se interessante fazer codificaes lineares nos valores das variveis para simplificar os clculos. Entretanto isso no acarreta maiores problemas, bastando, ao final, compensar as codificaes feitas. Por exemplo, se fizermos as transformaes
wi =
xi x0 e zi = y i y 0 , h
$ = a + bw, y $ y0 = a + b z
Essa expresso pode ser escrita
x x0 . h
bx b $ = a + y0 0 + x, y h h
que a equao da reta desejada na forma final.
Ex.: obter a equao da reta de mnimos quadrados para os seguintes pontos
linear.
Soluo. Na tabela seguinte temos os valores necessrios determinao dos
coeficientes da reta. Temos, aplicando as expresses anteriores, 36 9,2 = 50,5 41,4 = 9,1, 8 (36) 2 S xx = 204 = 204 162 = 42. 8 S xy = 50,5
1 2 3 4 5 6 7 8 36
S xy
1 4 9 16 25 36 49 64 204
y 2
Regresso - 7
Esse alto valor do coeficiente de correlao linear de Pearson justifica o traado da reta de regresso.
Em certos casos, sabemos que a reta terica de regresso deve passar pela origem, ou seja, que sua equao da forma
y = x .
Nesse caso, temos apenas a estimar o coeficiente angular da reta. A reta estimativa ser
$ = bx . y
n i =1
d i2 = min
n i =1
( y i bx i ) 2 .
Anulando a derivada em relao a b, temos, de forma anloga vista para o caso geral,
n n d ( y i bx i ) 2 = 0, 2i =1 x i ( y i bx i ) = 0, i =1 db n xy n n 2 1 i i i = 1 x i y i = b i = 1 x i , b = i = . n 2 x i =1 i
Assim, no exemplo anteriormente visto, se considerssemos que a reta de regresso devesse ultrapassar pela origem, o coeficiente b seria
b= 50,5 0,248, 204
Regresso - 8
O modelo de regresso linear simples que acabamos de estudar til em muitas situaes reais. Um caso que merece meno e que recai naquele modelo o das funes linearizveis. Certas funes, mediante transformaes convenientes, linearizam-se, o que torna simples a soluo do problema de regresso. Assim, por exemplo, se admitirmos que a funo de regresso seja uma funo exponencial do tipo y = x, a aplicao de logaritmos promove a linearizao da funo na forma
log y = log + x log .
Um artifcio simples para se saber se a transformao logartmica promove uma boa linearizao consiste em usar papis monologartmicos ou dilogartmicos. No presente caso, a adequabilidade da transformao vista seria evidenciada se, plotando-se os valores de x segundo escala linear e os de y segundo a escala logartmica de um papel monologartmico, os pontos observados se aproximassem de uma reta. Chamando z = log y , A = log e B = log , passamos a ter o problema de estimar os parmetros da reta
z = A + Bx ,
o qual sabemos resolver. Para tanto, basta trabalhar com os valores xi versus
zi = log y i , obtendo as estimativas de A e B, cujos antilogaritmos sero as estimativas de e
O mesmo princpio dos mnimos quadrados visto para a regresso linear poder Regresso - 9
ser aplicado se admitirmos que a funo de regresso um polinmio de grau k > 1. A diferena est em que temos k + 1 coeficientes a estimar. Tomando as derivadas parciais em relao s k + 1 estimativas, chegamos a um sistema de k + 1 equaes com k + 1 incgnitas o qual, resolvido, fornece a soluo do problema. Uma dificuldade tradicional nesse tipo de problema era a soluo do sistema no caso de valores relativamente grande de k. Com o surgimento dos computadores, essa dificuldade praticamente deixou de existir. A mesma observao vlida no caso de regresso linear mltipla. No caso de admitirmos que a funo de regresso seja uma parbola na forma y = + x + yx 2 , devemos obter a parbola-estimativa
$ p = a + bx + cx 2 . y
Se os valores de xi forem igualmente espaados, a soluo desse sistema fica bastante simplificada se trabalharmos com x i x ao invs dos xi , pois os somatrios de potenciais mpares se anulam. O sistema ficar ento
y i = na +c (x i x ) 2 , 2 (x i x ) y i =b (x i x ) , (x x ) 2 y = a (x x ) 2 + c (x x ) 4 . i i i i
Vemos que o coeficiente b do sistema modificado seria obtido diretamente, sendo o mesmo da reta, e restaria apenas resolver um sistema de duas equaes a duas incgnitas para se determinar a e c. A parbola seria, evidentemente, obtida na forma
$ p = a + b (x x ) + c(x x ) 2 . y
Regresso - 10
Ex. Ajustar a parbola de mnimos quadrados aos dados do exemplo anterior. Soluo. J temos
Falta obtermos
(x
x ) yi e
2
(x
xi
yi
(xi x ) 2
(xi x ) 2 yi
(xi x ) 4
1 2 3 4 5 6 7 8
Regresso - 11
y 2,0
1,5
1,0
0,5
Regresso - 12
______________________________________________________________________
Captulo 8 - Anova
A Anlise de Varincia (ANOVA) uma tcnica utilizada para se testar a igualdade entre mdias de vrios grupos. Supondo que amostras aleatrias e independentes de k populaes estejam disponveis, com n observaes cada e, denotando-se as k mdias por 1, 2,..., k, uma anlise de varincia para um fator (Oneway) pode ser conduzida para se testar a hiptese nula descrita da seguinte forma:
Ao contrrio do que sugere o nome, a Anova um teste para mdias e no para varincias. Criada por Sir R. A. Fisher por volta de 1920, este procedimento matemtico que desencadeou o desenvolvimento da Metodologia de Projeto de Experimentos e Superfcie de Resposta, baseado no relacionamento entre as duas formas bsicas de variao: a variao dentro da amostra e a variao entre amostras.
Anova - 1
______________________________________________________________________ A figura anterior mostra o princpio da anlise de varincia: uma comparao entre os dois tipos de variao existentes nas amostras provenientes de dados agrupados em nveis: a variao dentro (Within) e entre (Between). A variao dentro da amostra (Within) corresponde varincia (ou o desvio padro) que ocorre com as rplicas de um grupo. Do ponto de vista do controle estatstico de processo, a varincia dentro da amostra representa as variaes de causa comum que ocorrem com os processos produtivos, servios etc. Como cada grupo (ou nvel) ter uma mdia xi para as n observaes (repeties ou replicaes), possvel se calcular uma mdia para as i mdias de cada grupo. Dessa forma, considerando-se a mdia das mdias como o valor de tendncia central dos grupos, utilizando-se as diferenas entre cada mdia e a mdia geral, encontra-se a varincia entre os grupos. Em termos de controle de qualidade, a varincia entre (Between) a expresso matemtica para a variao de causas especiais. Dividindo-se a varincia entre pela varincia dentro obtm-se a estatstica de teste F. A distribuio F (Figura 8.2) criada para expressar todos os possveis valores desta razo entre varincias, inicia-se em zero e estende-se no sentido positivo do eixo x. Como por princpio, a varincia dentro deva ser constante para todos os grupos, a razo F aumentar muito quando as mdias dos grupos forem muito diferentes. Quanto mais diferentes, maior o valor de F. Se este valor ultrapassar o valor crtico para F, ento haver evidncia estatstica suficiente para se rejeitar a hiptese nula de igualdade entre as mltiplas mdias. Este teste muito utilizado para se verificar a influncia de certos fatores sobre uma resposta de interesse. Em termos prticos, pode-se testar como os diversos fatores presentes nos processos industriais, comerciais e outros, exercem influncia sobre uma caracterstica de qualidade dos produtos e servios. Quando dois nveis de um fator geram respostas mdias estatisticamente iguais, isto significa que o fator no influencia a resposta. Quando, ao contrrio, a resposta mdia em um nvel especfico estatisticamente diferente daquela obtida nos outros nveis, o fator significativo. Para um experimento de 2 fatores A e B, em dois nveis codificados (+1, -1), pode-se escrever a seguinte equao como modelo estatstico do experimento: Y ijk = + Ai + Bj + (AB)ij + ijk
(8.1)
Anova - 2
______________________________________________________________________ Onde: i = nmero de nveis do fator A (i = 1, 2, 3,..., a); j = nmero de nveis do Fator B (j = 1, 2, 3,..., b); k = nmero de rplicas de cada combinao de fatores (k = 1, 2, 3,..., n). O termo Y
ijk
parmetro comum a todos os tratamentos, denominado de mdia geral, Ai efeito do isimo tratamento do Fator A, Bj o efeito do j-simo tratamento do Fator B, (AB) ij, o efeito da ij-sima interao AB entre os fatores e ijk, um componente do erro aleatrio. Considere o seguinte experimento formado por dois fatores de interesse (Temperatura e Presso), em dois nveis cada um (40C e 60C, 25 e 35 PSI), com 4 rplicas:
TEMPERATURA 25 PSI 40C 130 74 150 159 155 180 188 126 1162
229 768
60 C
623
Tabela 8.1 Dados para uma ANOVA com 2 fatores, 2 nveis e 4 rplicas.
O parmetro de teste utilizado pela ANOVA para verificar a igualdade entre as mdias baseia-se na relao existente entre a variao dentro de um tratamento (Within) e a variao entre tratamentos (Between) (Figura 8.1).
Anova - 3
______________________________________________________________________ A variao dentro origina-se das rplicas. Calculando-se a mdia das rplicas, obtm-se a mdia dentro do tratamento. Quanto mais as rplicas diferirem desta mdia, maior ser a variao dentro deste tratamento. Na tabela 8.1 nota-se que as rplicas so muito diferentes, proporcionando uma variabilidade muito grande; por isso o boxplot largo (o intervalo interquartlico consideravelmente grande). A partir desse grfico, percebe-se que, para a Temperatura, a variao no nvel 40 maior do que no nvel 60. Cada um dos boxplots representa a variabilidade dentro de cada um dos dois nveis do fator, enquanto que a diferena entre as mdias denota a variao entre os fatores. A variao dentro tambm chamada de Erro. Dividindo-se a Variao Entre pela Variao Dentro obtm-se a Estatstica de Teste F, que, quando comparada com um valor de F crtico, definido segundo o nvel de significncia e o nmero de graus de liberdade (Figura 8.2), possibilita a aceitao ou rejeio da hiptese nula, acerca da igualdade entre as mdias dos nveis dos fatores. Sempre que se toma uma deciso ou se faz uma inferncia sobre uma populao a partir de dados amostrais corre-se o risco de se cometer algum tipo de erro. Hiptese to somente uma afirmao que se deseja testar, tendo como fonte de provas os dados provenientes da anlise da amostra.
Rejeitar Ho
()
Aceitar Ho
(1-)
Anova - 4
______________________________________________________________________ A figura 8.3, indica que os erros do Tipo I e II no podem ser cometidos simultaneamente.
Existem dois tipos de erro (mutuamente exclusivos) que podem ser cometidos em um teste de hipteses (figura 8.3). O primeiro o Erro Tipo I, que consiste em se rejeitar a hiptese nula quando ela verdadeira. A probabilidade de se cometer este tipo de erro , denominado nvel de significncia do teste. O segundo tipo o Erro Tipo II, que consiste em se aceitar a hiptese nula quando ela for falsa. A probabilidade de se cometer este tipo de erro . A probabilidade de se aceitar a hiptese nula quando ela verdadeira 1-, e denominado nvel de confiana do teste. A probabilidade de se rejeitar a hiptese nula quando ela for falsa 1-, e chamada de Poder do Teste. A amostra fornece a Estatstica de Teste, parmetro que quando comparado ao Valor Crtico determinado por , conduz aceitao ou rejeio da hiptese nula. Ao conjunto de todos os valores da estatstica de teste que levam rejeio da hiptese nula d-se o nome de Regio Crtica.
Anova - 5
______________________________________________________________________
Cada estatstica de teste est associada a uma distribuio de probabilidade (tstudent, F-Fisher, Qui-Quadrado, Normal Padronizada, etc.). No caso da ANOVA, a distribuio utilizada para o teste de hiptese a Distribuio F de Fisher-Snedecor.
Para se avaliar a significncia do efeito dos nveis de um tratamento A, bem como de um tratamento B, faz-se necessrio testar a hiptese da igualdade entre as respostas mdias obtidas com os nveis dos dois fatores. importante se determinar tambm, se existe interao entre os dois tratamentos. As hipteses necessrias neste caso esto representadas na tabela 3.2.
Para os dois Tratamentos, a aceitao de H0 significa que os efeitos na resposta obtidos com os dois nveis dos fatores A e B so iguais; a Hiptese Alternativa, que os tratamentos so diferentes. Na Interao, a aceitao de H0 indica que a Interao no significativa.
Anova - 6
______________________________________________________________________ FATOR B NVEL FATOR A 1 2 ... A 1 Y111, y112,...,y11n Y211, y212,...,y21n ... Ya11, ya12,...,y1n 2 Y121, y122,..,y12n Y221, y222,..,y22n ... Ya21, ya22,..,y2n ... ... b Y1b1, y1b2,...,y1n Y2b1, y2b2,...,y2bn ... Yab1, yab2,...,yabn
Para expressar genericamente um arranjo geral de dois tratamentos (Fatores), definir-se- uma simbologia a ser adotada. Antes, porm, deve ser ressaltado que cada Fator A pode possuir a nveis (..., -2, -1, 0, 1, 2...), que cada Fator B, b nveis (..., -2, -1, 0, 1, 2...), e que ainda, um determinado tratamento pode possuir n rplicas (observaes). Um arranjo geral poderia ser construdo como sugere o quadro 8.2, com as seguintes formulaes para seus elementos:
a n
j =1 k =1
y ijk
1 bn
1 an
y
j =1 k =1
ijk
i =1 k =1
y ijk
y
i =1 k =1
ijk
k =1
y ijk
1 n
y
k =1
b
ijk
i =1
j =1 k =1
y ijk
1 abn
y
i =1 j =1 k =1
ijk
Quadro 8.2 Frmulas para o Clculo das Somas de Quadrados de Anova para 2 fatores.
Com estes somatrios, pode-se escrever a Soma de Quadrados Total para o modelo:
Anova - 7
______________________________________________________________________
( yijk yMT ) 2 = ( yML yMT ) + ( yMC yMT ) + ( yMCEL yML yMC yMT ) + (yijk yMT ) =
a b n a b n 2 i =1 j =1 k =1 a i =1 j =1 k =1 b
= bn ( yML yMT ) + an ( yMC - yMT )2 + n ( yMCEL yML yMC + yMT ) + ( yijk yMC ) 2
2 i =1 j =1 i =1 j =1 i =1 j =1 k =1
Dessa maneira, a Soma de Quadrados Total do arranjo pode ser dividida em somas de quadrados devido aos tratamentos de linha (Fator A) SSA, aos tratamentos de coluna (Fator B) SSB; a soma de quadrados devido interao entre A e B, SSAB e a soma de quadrados devido ao erro experimental SSE. Desse modo, pode-se escrever que: SST= SSA+ SSB+ SSAB+ SSE O quadro 8.3 apresenta os clculos necessrios para se proceder a Anlise de Varincia para dois fatores. Ressalte-se que o nmero de graus de liberdade em uma soma de quadrados igual ao nmero de elementos independentes naquela soma. As equaes das somas de quadrados podem ainda ser escritas de maneira simplificada, como:
2 SST = yijk i =1 j =1 k =1 a b n
yst , abn
SS A =
SSB =
Para se obter uma simplificao da Soma de Quadrados referentes interao aconselhvel calcular-se primeiramente a soma de quadrados entre os totais das clulas ab, o que se pode chamar de Soma de Quadrados Parcial, tal que:
SS p =
y 1 a b 2 y scel st n i =1 j =1 abn
SSAB = SSP SSA SSB Assim, pode-se encontrar a parcela de variao devido ao erro, tal que:
Anova - 8
______________________________________________________________________ A Mdia Quadrtica o quociente entre a soma de quadrados e o nmero de graus de liberdade associados, respectivamente, a cada fonte de variao.
Mdia Quadrtica
MS A = MS B = SS A a-1 SS A b-1
MS A MS E MS B MS E
MS AB MS E
MS AB =
SS A (a - 1)(b - 1)
SS E ab(n - 1)
MS A =
Fo representa a estatstica de teste para a anlise de dois grupos de dados. Utilizando-se os dados do exemplo, obtm-se os seguintes resultados:
SS T = y
i =1 j =1 k =1
2 ijk
1 a 2 y st 1 1870 = SS A = y sl ( 768 ) 2 + (1102 ) 2 = 6972 ,25 abn 2 x 4 bn i =1 2 x2 x4 1 b 2 y st 1 1870 = ( 708 ) 2 + (1162 ) 2 SS B = y sc = 12885 , 25 abn 2 x 4 an j =1 2x2x4 SS A + SS B = 6972 , 25 + 12885 , 25 = 19854 ,50
2
SS AB =
y 1 a b 2 y scel st SS A SS B abn n i =1 j =1 1 (539 ) 2 + (623) 2 + ( 229 ) 2 + ( 479 ) 2 19854 ,25 218 .556 ,25 = 1722 ,25 4
SS AB =
Anova - 9
______________________________________________________________________ SSE = SST SSAB SSA SSB = 31868 19854,50 1722,25 = 10291,00 Assim, pode-se compor a seguinte tabela de Anlise de Varincia:
Fonte
SS
GL
Fo
Tratamentos
19854,50
MS AB =
1 12 15
MSAB = 1722,25
MS E = 10291,00 = 857,58 12
Da tabela para a Distribuio F da seo de anexos, com o nvel de significncia = 0,05, com os graus de liberdade do numerador e do denominador das duas fontes de Variao (Tratamentos e Interao), tem-se que:
a) F (2, 12, alfa=0,05) = 3,89 << 11,58, portanto, rejeita-se a hiptese nula (de que os Efeitos dos dois tratamentos so iguais). Logo, aceita-se a hiptese alternativa H1 de que os efeitos so distintos. O P-Value tambm fornece essa concluso. O P-Value a
probabilidade de se obter um valor da estatstica amostral de teste no mnimo to extremo como o que resulta dos dados amostrais, na suposio de a hiptese nula ser verdadeira. No presente exemplo, P-value igual a 0,00158, valor bem menor que o nvel de significncia do teste, que alfa = 0,05.
b) F
= 4,75 > 2,01, portanto, deve-se aceitar Ho, ou seja, a interao entre
os tratamentos A e B no estatisticamente significativa. O P-Value fornece a mesma concluso (P-Value=0,182 >> alfa =0,05).
A Anlise de Varincia com mais de dois fatores um tanto complexa, no entanto, no muito diferente do procedimento demonstrado neste item.
Anova - 10
______________________________________________________________________
A anlise de varincia considera que as observaes analisadas sigam distribuio, com varincia constante. Isto, em geral, verificado atravs da anlise dos resduos (ou erros) calculados entre as observaes e a mdia do grupo ao qual elas pertencem. Um resduo a diferena entre uma observao yij e o seu valor estimado
ij . Para que o modelo de anlise (ou ajustado) a partir do modelo estatstico estudado, y
seja vlido, os resduos devem ser aleatrios, normais, independentes (no correlacionados) e identicamente distribudos.
PRESSO 35 PSI
-4,75
40C
-60,75 -5,75
60C
y ijk = 134,75
^
y ijk = 57,25
^
3,25
y ijk = 155,75
y ijk = 119,75
Se um modelo est correto, os resduos devem estar desestruturados; em particular, eles no devem estar correlacionados com qualquer varivel includa na resposta predita. Uma anomalia que ocasionalmente ocorre neste tipo de grfico o da Variao no constante. s vezes, a varincia das observaes aumenta com o incremento da magnitude das observaes. Isto viola o princpio da homogeneidade da varincia. Os grficos que representam a heterocedasticidade apresentaro resduos dispostos em forma funil ou de borboleta, o que caracteriza um padro de tendncia. Varincia no constante tambm ocorre quando os dados no so normalmente distribudos, seguindo, portanto, distribuies assimtricas. Nesse tipo de distribuio a
Anova - 11
______________________________________________________________________ varincia tende a ser funo da mdia. Nota-se, contudo, que o grfico do exemplo (Figura 8.5) no apresenta este tipo de anormalidade.
Os resduos devem apresentar comportamentos aleatrios quando dispostos em uma ordem temporal. Se qualquer padro no-aleatrio for identificado nestes tipos de grficos, uma transformao de dados (Log, Raiz Quadrada, Box-Cox) na resposta Y deve ser realizada. A tendncia de se ter resduos positivos ou negativos indicam uma correlao positiva, o que implicaria na violao da hiptese de independncia dos resduos. Uma aleatorizao apropriada do experimento um bom procedimento para a garantia dessa independncia. Algumas vezes, a habilidade do experimentador em executar o experimento pode mudar com o progresso da experimentao, ou, conquanto o processo esteja sendo estudado constantemente, pode se tornar mais inconsistente. Isto sempre resultar em uma mudana no erro da varincia ao longo do tempo. O grfico que surge dessa situao revela uma relao resduo versus ordem com mais variao do que as outras. A utilizao dos Resduos Padronizados gera mais informao sobre a qualidade da resposta do que os resduos ordinrios. Os Resduos Padronizados (d) podem ser obtidos dividindo-se os resduos das observaes em relao mdia das rplicas (FIT) pelo desvio padro das rplicas (SE Fit). Deste modo, tais resduos possuiro mdia igual a zero e desvio padro unitrio. Conseqentemente, eles sero teis na identificao de outliers. A maior parte dos resduos padronizados deve encontrar-se no intervalo 3 d 3, e qualquer observao com resduo padronizado fora deste intervalo pode representar uma resposta observada potencialmente no usual ou
Anova - 12
______________________________________________________________________ incorreta. Estes outliers devem ser examinados com cuidado: tanto pode indicar erros de registro, quanto algo mais preocupante. Em relao ao exemplo em questo, no h evidncias de padres no-aleatrios presentes (Figura 8.6).
Figura 8.6 Grfico dos Resduos Padronizados versus tempo (ordem da observao).
O grfico da figura 8.7 representa o ajuste dos resduos a uma Distribuio Normal e serve como indicador de sua normalidade.
Anova - 13
______________________________________________________________________ Para o exemplo dado, a direo dos pontos parece constante, assemelhando-se a uma reta. Quanto maior for a concentrao de pontos sob a reta na sua regio central, com uma diminuio para as extremidades, mais ajustados estaro os resduos. Esse grfico construdo dispondo-se os resduos em ordem crescente sob o eixo das abscissas, enquanto que a varivel reduzida Z escrita sobre o eixo das ordenadas. Uma outra maneira de verificar a normalidade dos resduos proceder ao teste de normalidade, disponvel em muitos pacotes estatsticos computacionais. Um valor de P-Value maior do que o nvel de significncia de 0,05 (5%) indica que os resduos so normais. No presente exemplo, P-Value igual a 0,875, que bem maior que o nvel de significncia. Portanto, no h problemas com os resduos.
Anova - 14
Q2=120
(06) Uma soluo: A={10,11,12,14,25}, B={30,33,36,39,42,45} (07) 70 (08) R$2235,00 (09) 106 (10) A amplitude ultrapassa o valor alegado ~=9 (12) x = 8.38 x no h moda (13) a) x =28.03 s=7.28
c)26.9 d)11.4
b) Q1=37.5 Q3=112.3
Q2=75.5
(14) Aparentemente, o primeiro mais preciso; mas a comparao pode estar prejudicada pelo fato de terem sido medidos objetos diferentes (17) b) x =22.7 s=6.02
(18) a) x =28.92 c) 16.7%
b)s=2.31
Exerccios III
58 42 100
70 30 100
50 50 100
Exerccios IV
b) c) e)
(06) a) 0.986 (07) 1/12 (08) (09) a) 0.72 (10) sim (11) 3 (12) a) 0.54 (13) a) 0.9978 (15) 0.63 (16) a) 1/12 (17) 0.396 (18) a) (19)
b) 0.982
b) 0.98
b) 0.04 b) 0.0112
c) 0.42
b) 13/36
c) 6/13
(20) Um carto com 10 dezenas (21) 2.5% (23) 97.5% (24) 0.8% (25) 2.35% (26) a) 0.84% (27) 13.63% (28) 32.25% (29) a) 99.5% b) 14.5% c) 96.5% b) 0.04%
Exerccios V
(01) b) 26/27
c) 8/27
(04) a) no (05)
b) no
c) sim
d) no
Exerccios VI
(01) -R$0.25 (02) 1.7 (05) E(G) = 2.75 e VAR(G) = 0.412 (06) U$ 25 (07) 36.78%
Exerccios VIII
(01) P(X=6)= 0.296 (02) a) 0.251 (03) 0.0819 (04) a) 0.0858 (05) 0.1198 (06) a) 0.38 (07) 0.25 (08) a) 1312 (09) a) 1 (10) a) 0.107 b) 562 b) 0.9267 c) 188 b) 0.3455 b) 0.126 b) 0.126 c) 0.363 d) 0.858
Exerccios IX
(01) a) 22.4% (02) 18.13% (03) 1.4% (04) 80.9% (05) 20.76% (06) 5.6% (07) 0.89% (08) 4.7%
b) 14.9%
c) 57.7%
Respostas - 3
(09) 5/14
Exerccios X
(01) 40% (02) 20% (03) R$25.000,00 (04) a) 60.65% (05) 45.11%
Exerccios XI
(01) a) 109.70 (02) 5 anos (03) a) 0.26% (04) 63 (05) a) 263 (06) a) 19.36% (07) 734 (09) a) 0.582 (10) 0.21 (11) a) 12.92% (12) a) 86.43% (13) a) 0.12 (14) 25.14% (15) 0.1335
b) 86.56 b) 7.10-6
c) 0.9948
b) 20 b) 39.7%
c) 0
b) 0.7422
Exerccios XII
(01) a) 68% (02) a) 512,80 (03) a) 5,82% (04) a) 35,20% (05) a) 2,27% (06) a) 4,75% (07) a) 26,44%
d) 4.
(08) a) 31,25% b) 0,97 Exerccios XIII (01) 23% (02) 81 (03) a) 0 e 400/n d) 5,16% (05) 0,06%
$1 ) = p (08) E ( p
c) 95
b) 61,70% e) 1537
$1 ) = Var ( p
c) 31,74%
p (1 p ) n
$2 ) = p E( p
$ 2 ) = p (1 p ) Var ( p
(09) 170 2,94 165 3,18 (10) a) ]787,1; 812,9[ (11) a) 384 (12) a) 307 b) 666 b) ]49; 51[
(13) ]0,677; 0,732[ (14) ]0,25; 0,35[, ]0,255; 0,345[ (15) a) 3932 b) ]0,5345; 0,5655[ b) 2401 b) 107.584 c) 3.841.600 (16) a) ]0,274; 0,386[ (17) a) ]148,37; 151,63[ (18) a) ]5,13; 7,31[ (19) 400 20,46 (20) a) ]0,543; 0,657[ (21) 0,520 0,049 (22) 510,6 0,784
Exerccios XIV
b) 1,440 b) 0,105
c) -1,812 c) 3,84
d) 2,131 d) 1,35
f) 3,160 f) 1,8275
b) 6,68%
c) RC = [1171; [
Respostas - 5
(02) No, pois z0 = -1,5 e RC =] - ; - 1,645] (03) Sim, pois z0 = -2,8 e RC =] - ; - 1,645] (06) Rejeita-se a hiptese p = 0,20, pois Z0 = 1,36 e RC =]1,28; [ (09) 27,43% (15) H0 no rejeitado, pois z0 = 1,94 e RC = [ - 1,96; 1,96] (18) a) 0,3% b) 87,2% (22) a) 41,56 5,51
Exerccios XVIII
Respostas - 6
Referncia Bibliogrfica
1) Meyer, P. L., Probabilidade: Aplicaes Estatstica.Livros Tcnicos e Cientficos Editora S.A., 1978
3) Soares, J.F.; Farias, A.A.; Cesar, C.C.; Introduo Estatstica. Guanabara Koogan, 1991
4) Soong, T.T., Modelos Probabilsticos em Engenharia e Cincias. .Liv. Tc.e Cientficos Editora S.A., 1986
6) Hoel, P.G. , Introduction to Mathematical Statistics. John Wiley, New York, 1962
9) Bowker, A. H., Lieberman, G. J., Engineering Statistics. Prentice-Hall, New Jersey, 1972
10) Cochran, W. G., Tcnicas de Amostragem. Fundo de Cultura, Rio de Janeiro, 1965
( x ) =
1 2
e t dt
22
x
-3,10 -3,09 -3,08 -3,07 -3,06 -3,05 -3,04 -3,03 -3,02 -3,01 -3,00 -2,99 -2,98 -2,97 -2,96 -2,95 -2,94 -2,93 -2,92 -2,91 -2,90 -2,89 -2,88 -2,87 -2,86 -2,85 -2,84 -2,83 -2,82 -2,81 -2,80 -2,79 -2,78 -2,77 -2,76 -2,75 -2,74 -2,73 -2,72 -2,71 -2,70 -2,69 -2,68 -2,67 -2,66 -2,65 -2,64 -2,63 -2,62 -2,61 -2,60 -2,59 -2,58 -2,57 -2,56 -2,55
(x )
0,000968 0,001001 0,001035 0,001070 0,001107 0,001144 0,001183 0,001223 0,001264 0,001306 0,001350 0,001395 0,001441 0,001489 0,001538 0,001589 0,001641 0,001695 0,001750 0,001807 0,001866 0,001926 0,001988 0,002052 0,002118 0,002186 0,002256 0,002327 0,002401 0,002477 0,002555 0,002635 0,002718 0,002803 0,002890 0,002980 0,003072 0,003167 0,003264 0,003364 0,003467 0,003573 0,003681 0,003793 0,003907 0,004025 0,004145 0,004269 0,004396 0,004527 0,004661 0,004799 0,004940 0,005085 0,005234 0,005386
x
-2,54 -2,53 -2,52 -2,51 -2,50 -2,49 -2,48 -2,47 -2,46 -2,45 -2,44 -2,43 -2,42 -2,41 -2,40 -2,39 -2,38 -2,37 -2,36 -2,35 -2,34 -2,33 -2,32 -2,31 -2,30 -2,29 -2,28 -2,27 -2,26 -2,25 -2,24 -2,23 -2,22 -2,21 -2,20 -2,19 -2,18 -2,17 -2,16 -2,15 -2,14 -2,13 -2,12 -2,11 -2,10 -2,09 -2,08 -2,07 -2,06 -2,05 -2,04 -2,03 -2,02 -2,01 -2,00 -1,99
(x )
0,005543 0,005703 0,005868 0,006037 0,006210 0,006387 0,006569 0,006756 0,006947 0,007143 0,007344 0,007549 0,007760 0,007976 0,008198 0,008424 0,008656 0,008894 0,009137 0,009387 0,009642 0,009903 0,010170 0,010444 0,010724 0,011011 0,011304 0,011604 0,011911 0,012224 0,012545 0,012874 0,013209 0,013553 0,013903 0,014262 0,014629 0,015003 0,015386 0,015778 0,016177 0,016586 0,017003 0,017429 0,017864 0,018309 0,018763 0,019226 0,019699 0,020182 0,020675 0,021178 0,021692 0,022216 0,022750 0,023295
x
-1,98 -1,97 -1,96 -1,95 -1,94 -1,93 -1,92 -1,91 -1,90 -1,89 -1,88 -1,87 -1,86 -1,85 -1,84 -1,83 -1,82 -1,81 -1,80 -1,79 -1,78 -1,77 -1,76 -1,75 -1,74 -1,73 -1,72 -1,71 -1,70 -1,69 -1,68 -1,67 -1,66 -1,65 -1,64 -1,63 -1,62 -1,61 -1,60 -1,59 -1,58 -1,57 -1,56 -1,55 -1,54 -1,53 -1,52 -1,51 -1,50 -1,49 -1,48 -1,47 -1,46 -1,45 -1,44 -1,43
(x )
0,023852 0,024419 0,024998 0,025588 0,026190 0,026803 0,027429 0,028067 0,028717 0,029379 0,030054 0,030742 0,031443 0,032157 0,032884 0,033625 0,034379 0,035148 0,035930 0,036727 0,037538 0,038364 0,039204 0,040059 0,040929 0,041815 0,042716 0,043633 0,044565 0,045514 0,046479 0,047460 0,048457 0,049471 0,050503 0,051551 0,052616 0,053699 0,054799 0,055917 0,057053 0,058208 0,059380 0,060571 0,061780 0,063008 0,064256 0,065522 0,066807 0,068112 0,069437 0,070781 0,072145 0,073529 0,074934 0,076359
x
-1,42 -1,41 -1,40 -1,39 -1,38 -1,37 -1,36 -1,35 -1,34 -1,33 -1,32 -1,31 -1,30 -1,29 -1,28 -1,27 -1,26 -1,25 -1,24 -1,23 -1,22 -1,21 -1,20 -1,19 -1,18 -1,17 -1,16 -1,15 -1,14 -1,13 -1,12 -1,11 -1,10 -1,09 -1,08 -1,07 -1,06 -1,05 -1,04 -1,03 -1,02 -1,01 -1,00 -0,99 -0,98 -0,97 -0,96 -0,95 -0,94 -0,93 -0,92 -0,91 -0,90 -0,89 -0,88 -0,87
(x )
0,077804 0,079270 0,080757 0,082264 0,083793 0,085344 0,086915 0,088508 0,090123 0,091759 0,093418 0,095098 0,096801 0,098525 0,100273 0,102042 0,103835 0,105650 0,107488 0,109349 0,111233 0,113140 0,115070 0,117023 0,119000 0,121001 0,123024 0,125072 0,127143 0,129238 0,131357 0,133500 0,135666 0,137857 0,140071 0,142310 0,144572 0,146859 0,149170 0,151505 0,153864 0,156248 0,158655 0,161087 0,163543 0,166023 0,168528 0,171056 0,173609 0,176186 0,178786 0,181411 0,184060 0,186733 0,189430 0,192150
x
-0,86 -0,85 -0,84 -0,83 -0,82 -0,81 -0,80 -0,79 -0,78 -0,77 -0,76 -0,75 -0,74 -0,73 -0,72 -0,71 -0,70 -0,69 -0,68 -0,67 -0,66 -0,65 -0,64 -0,63 -0,62 -0,61 -0,60 -0,59 -0,58 -0,57 -0,56 -0,55 -0,54 -0,53 -0,52 -0,51 -0,50 -0,49 -0,48 -0,47 -0,46 -0,45 -0,44 -0,43 -0,42 -0,41 -0,40 -0,39 -0,38 -0,37 -0,36 -0,35 -0,34 -0,33 -0,32 -0,31
(x )
0,194894 0,197663 0,200454 0,203269 0,206108 0,208970 0,211855 0,214764 0,217695 0,220650 0,223627 0,226627 0,229650 0,232695 0,235762 0,238852 0,241964 0,245097 0,248252 0,251429 0,254627 0,257846 0,261086 0,264347 0,267629 0,270931 0,274253 0,277595 0,280957 0,284339 0,287740 0,291160 0,294599 0,298056 0,301532 0,305026 0,308538 0,312067 0,315614 0,319178 0,322758 0,326335 0,329969 0,333598 0,337243 0,340903 0,344578 0,348268 0,351973 0,355691 0,359424 0,363169 0,366928 0,370700 0,374484 0,378281
(x )
0,382089 0,385908 0,389739 0,393580 0,397432 0,401294 0,405165 0,409046 0,412936 0,416834 0,420740 0,424655 0,428576 0,432505 0,436441 0,440382 0,444330 0,448283 0,452242 0,456205 0,460172 0,464144 0,468119 0,472097 0,476078 0,480061 0,484047 0,488034 0,492022 0,496011 0,500000 0,503989 0,507978 0,511967 0,515953 0,519939 0,523922 0,527903 0,531881 0,535856 0,539828 0,543795 0,547758 0,551717 0,555670 0,559618 0,563559 0,567495 0,571424 0,575345 0,579260 0,583166 0,587064 0,590954 0,594835 0,598706 0,602568 0,606420 0,610261 0,614092 0,617911 0,621719 0,625516 0,629300 0,633072 0,636831 0,640576 0,644309
x
0,38 0,39 0,40 0,41 0,42 0,43 0,44 0,45 0,46 0,47 0,48 0,49 0,50 0,51 0,52 0,53 0,54 0,55 0,56 0,57 0,58 0,59 0,60 0,61 0,62 0,63 0,64 0,65 0,66 0,67 0,68 0,69 0,70 0,71 0,72 0,73 0,74 0,75 0,76 0,77 0,78 0,79 0,80 0,81 0,82 0,83 0,84 0,85 0,86 0,87 0,88 0,89 0,90 0,91 0,92 0,93 0,94 0,95 0,96 0,97 0,98 0,99 1,00 1,01 1,02 1,03 1,04 1,05
(x )
0,648027 0,651732 0,655422 0,659097 0,662757 0,666402 0,670031 0,673645 0,677242 0,680822 0,684386 0,687933 0,691462 0,694974 0,698468 0,701944 0,705401 0,708840 0,712260 0,715661 0,719043 0,722405 0,725747 0,729069 0,732371 0,735653 0,738914 0,742154 0,745373 0,748571 0,751748 0,754903 0,758036 0,761148 0,764238 0,767305 0,770350 0,773373 0,776373 0,779350 0,782305 0,785236 0,788145 0,791030 0,793892 0,796731 0,799546 0,802337 0,805106 0,807850 0,810570 0,813267 0,815940 0,818589 0,821214 0,823814 0,826391 0,828944 0,831472 0,833977 0,836457 0,838913 0,841345 0,843752 0,846136 0,848495 0,850830 0,853141
x
1,06 1,07 1,08 1,09 1,10 1,11 1,12 1,13 1,14 1,15 1,16 1,17 1,18 1,19 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 1,31 1,32 1,33 1,34 1,35 1,36 1,37 1,38 1,39 1,40 1,41 1,42 1,43 1,44 1,45 1,46 1,47 1,48 1,49 1,50 1,51 1,52 1,53 1,54 1,55 1,56 1,57 1,58 1,59 1,60 1,61 1,62 1,63 1,64 1,65 1,66 1,67 1,68 1,69 1,70 1,71 1,72 1,73
(x )
0,855428 0,857690 0,859929 0,862143 0,868334 0,866500 0,868643 0,870762 0,872857 0,874928 0,876976 0,878999 0,881000 0,882977 0,884930 0,886860 0,888767 0,890651 0,892512 0,894350 0,896165 0,897958 0,899727 0,901475 0,903199 0,904902 0,906582 0,908241 0,909877 0,911492 0,913085 0,914657 0,916207 0,917736 0,919243 0,920730 0,922196 0,923641 0,925066 0,926471 0,927855 0,929219 0,930563 0,931888 0,933193 0,934478 0,935744 0,936992 0,938220 0,939429 0,940620 0,941792 0,942947 0,944083 0,945201 0,946301 0,947384 0,948449 0,949497 0,950529 0,951543 0,952540 0,953521 0,954486 0,955435 0,956367 0,957284 0,958185
x
1,74 1,75 1,76 1,77 1,78 1,79 1,80 1,81 1,82 1,83 1,84 1,85 1,86 1,87 1,88 1,89 1,90 1,91 1,92 1,93 1,94 1,95 1,96 1,97 1,98 1,99 2,00 2,01 2,02 2,03 2,04 2,05 2,06 2,07 2,08 2,09 2,10 2,11 2,12 2,13 2,14 2,15 2,16 2,17 2,18 2,19 2,20 2,21 2,22 2,23 2,24 2,25 2,26 2,27 2,28 2,29 2,30 2,31 2,32 2,33 2,34 2,35 2,36 2,37 2,38 2,39 2,40 2,41
(x )
0,959071 0,959941 0,960796 0,961636 0,962462 0,963273 0,964070 0,964852 0,965621 0,966375 0,967116 0,967843 0,968557 0,969258 0,969946 0,970621 0,971283 0,971933 0,972571 0,973197 0,973810 0,974412 0,975002 0,975581 0,976148 0,976705 0,977250 0,977784 0,978308 0,978822 0,979325 0,979818 0,980301 0,980774 0,981237 0,981691 0,982136 0,982571 0,982997 0,983414 0,983823 0,984222 0,984614 0,984997 0,985371 0,985738 0,986097 0,986447 0,986791 0,987126 0,987455 0,987776 0,988089 0,988396 0,988696 0,988989 0,989276 0,989556 0,989830 0,990097 0,990358 0,990613 0,990863 0,991106 0,991344 0,991576 0,991802 0,992024
x
2,42 2,43 2,44 2,45 2,46 2,47 2,48 2,49 2,50 2,51 2,52 2,53 2,54 2,55 2,56 2,57 2,58 2,59 2,60 2,61 2,62 2,63 2,64 2,65 2,66 2,67 2,68 2,69 2,70 2,71 2,72 2,73 2,74 2,75 2,76 2,77 2,78 2,79 2,80 2,81 2,82 2,83 2,84 2,85 2,86 2,87 2,88 2,89 2,90 2,91 2,92 2,93 2,94 2,95 2,96 2,97 2,98 2,99 3,00 3,01 3,02 3,03 3,04 3,05 3,06 3,07 3,08 3,09
(x )
0,992240 0,992451 0,992656 0,993857 0,993053 0,993244 0,993431 0,993613 0,993790 0,994963 0,994132 0,994297 0,994457 0,994614 0,994766 0,995915 0,995060 0,995201 0,995339 0,995473 0,995604 0,995731 0,995855 0,996975 0,996093 0,996207 0,996319 0,996427 0,996533 0,996636 0,996736 0,996833 0,996928 0,997020 0,997110 0,997197 0,997282 0,997365 0,997445 0,997523 0,997599 0,997673 0,997744 0,997814 0,997882 0,997948 0,998012 0,998074 0,998134 0,998193 0,998250 0,998305 0,998359 0,998411 0,998462 0,998511 0,998559 0,998605 0,998650 0,998694 0,998736 0,998777 0,998817 0,998856 0,998893 0,998930 0,998965 0,998999
r
0 1 2 3 4 5 6 7 8
0,1
0,9048 0,9953 0,9998 1,0000
0,2
0,8187 0,9824 0,9988 0,9999 1,0000
0,3
0,7408 0,9630 0,9964 0,9997 0,9999 1,0000
0,4
0,6703 0,9384 0,9920 0,9992 0,9999 1,0000
0,5
0,6065 0,9098 0,9856 0,9982 0,9998 0,9999 1,0000
0,6
0,5488 0,8781 0,9768 0,9966 0,9996 0,9999 1,0000
0,7
0,4965 0,8442 0,9658 0,9942 0,9992 0,9999 0,9999 1,0000
0,8
0,4493 0,8087 0,9525 0,9909 0,9985 0,9998 0,9999 1,0000
0,9
0,4065 0,7724 0,9371 0,9865 0,9976 0,9996 0,9999 1,0000
1,0
0,3679 0,7358 0,9197 0,9810 0,9963 0,9994 0,9999 1,0000
1,1
0,3329 0,6990 0,9004 0,9743 0,9946 0,9990 0,9999 1,0000
1,2
0,3012 0,6626 0,8795 0,9662 0,9923 0,9985 0,9997 1,0000
1,3
0,2725 0,6268 0,8571 0,9569 0,9893 0,9978 0,9996 0,9999 1,0000
1,4
0,2466 0,5918 0,8335 0,9463 0,9857 0,9968 0,9994 0,9999 1,0000
r
0 1 2 3 4 5 6 7 8 9 10 11
1,5
0,2231 0,5578 0,8088 0,9344 0,9814 0,9955 0,9991 0,9998 1,0000
1,6
0,2019 0,5249 0,7834 0,9212 0,9763 0,9940 0,9987 0,9997 1,0000
1,7
0,1827 0,4932 0,7572 0,9068 0,9704 0,9920 0,9981 0,9996 0,9999 1,0000
1,8
0,1653 0,4628 0,7306 0,8913 0,9636 0,9896 0,9974 0,9994 0,9999 1,0000
1,9
0,1496 0,4337 0,7037 0,8747 0,9559 0,9868 0,9966 0,9992 0,9998 1,0000
2,0
0,1353 0,4060 0,6767 0,8571 0,9473 0,9834 0,9955 0,9989 0,9998 1,0000
2,1
0,1225 0,3796 0,6496 0,8386 0,9379 0,9796 0,9941 0,9985 0,9997 0,9999 1,0000
2,2
0,1108 0,3546 0,6227 0,8194 0,9275 0,9751 0,9925 0,9980 0,9995 0,9999 1,0000
2,3
0,1003 0,3309 0,5960 0,7993 0,9162 0,9700 0,9906 0,9974 0,9994 0,9999 1,0000
2,4
0,0907 0,3084 0,5697 0,7787 0,9041 0,9643 0,9884 0,9967 0,9991 0,9998 1,0000
2,5
0,0821 0,2873 0,5438 0,7576 0,8912 0,9580 0,9858 0,9958 0,9989 0,9997 0,9999 1,0000
2,6
0,0743 0,2674 0,5184 0,7360 0,8774 0,9510 0,9828 0,9947 0,9985 0,9996 0,9999 1,0000
2,7
0,0672 0,2487 0,4936 0,7141 0,8629 0,9433 0,9794 0,9934 0,9981 0,9995 0,9999 1,0000
2,8
0,0608 0,2311 0,4695 0,6919 0,8477 0,9349 0,9756 0,9919 0,9976 0,9993 0,9998 1,0000
r
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
2,9
0,0550 0,2146 0,4460 0,6696 0,8318 0,9258 0,9713 0,9901 0,9969 0,9991 0,9998 0,9999 1,0000
3,0
0,0498 0,1991 0,4232 0,6472 0,8153 0,9161 0,9665 0,9881 0,9962 0,9989 0,9997 0,9999 1,0000
3,1
0,0450 0,1847 0,4012 0,6248 0,7982 0,9057 0,9612 0,9858 0,9953 0,9986 0,9996 0,9999 1,0000
3,2
0,0408 0,1712 0,3799 0,6052 0,7806 0,8946 0,9554 0,9832 0,9943 0,9982 0,9995 0,9999 1,0000
3,3
0,0369 0,1586 0,3594 0,5803 0,7626 0,8829 0,9490 0,9802 0,9931 0,9978 0,9994 0,9998 1,0000
3,4
0,0334 0,1468 0,3397 0,5584 0,7442 0,8705 0,9421 0,9769 0,9917 0,9973 0,9992 0,9998 0,9999 1,0000
3,5
0,0302 0,1359 0,3208 0,5366 0,7254 0,8576 0,9347 0,9733 0,9901 0,9967 0,9990 0,9997 0,9999 1,0000
3,6
0,0273 0,1257 0,3027 0,5152 0,7064 0,8441 0,9267 0,9692 0,9883 0,9960 0,9987 0,9996 0,9999 1,0000
3,7
0,0247 0,1162 0,2854 0,4942 0,6872 0,8301 0,9182 0,9648 0,9863 0,9952 0,9984 0,9995 0,9999 1,0000
3,8
0,0224 0,1074 0,2689 0,4735 0,6678 0,8156 0,9091 0,9599 0,9840 0,9942 0,9981 0,9994 0,9998 1,0000
3,9
0,0202 0,0992 0,2531 0,4532 0,6484 0,8006 0,8995 0,9546 0,9815 0,9931 0,9977 0,9993 0,9998 0,9999 1,0000
4,0
0,0183 0,0916 0,2381 0,4335 0,6288 0,7851 0,8893 0,9489 0,9786 0,9919 0,9972 0,9991 0,9997 0,9999 1,0000
4,1
0,0166 0,0845 0,2238 0,4142 0,6093 0,7693 0,8786 0,9427 0,9755 0,9905 0,9966 0,9989 0,9997 0,9999 1,0000
4,2
0,0150 0,0780 0,2102 0,3954 0,5898 0,7531 0,8675 0,9361 0,9721 0,9889 0,9959 0,9986 0,9996 0,9999 1,0000
4,3
0,0136 0,0719 0,1974 0,3772 0,5704 0,7367 0,8558 0,9290 0,9683 0,9871 0,9952 0,9983 0,9995 0,9998 1,0000
4,4
0,0123 0,0663 0,1851 0,3594 0,5512 0,7199 0,8436 0,9214 0,9642 0,9851 0,9943 0,9980 0,9993 0,9998 0,9999 1,0000
4,5
0,0111 0,0611 0,1736 0,3423 0,5321 0,7029 0,8311 0,9134 0,9597 0,9829 0,9933 0,9976 0,9992 0,9997 0,9999 1,0000
4,6
0,0101 0,0563 0,1626 0,3257 0,5132 0,6858 0,8180 0,9049 0,9549 0,9805 0,9922 0,9971 0,9990 0,9997 0,9999 1,0000
4,7
0,0091 0,0518 0,1523 0,3097 0,4946 0,6684 0,8046 0,8960 0,9497 0,9778 0,9910 0,9966 0,9988 0,9996 0,9999 1,0000
4,8
0,0082 0,0477 0,1452 0,2942 0,4763 0,6510 0,7908 0,8867 0,9442 0,9749 0,9896 0,9960 0,9986 0,9995 0,9999 1,0000
4,9
0,0074 0,439 0,1333 0,2793 0,4582 0,6335 0,7767 0,8769 0,9382 0,9717 0,9880 0,9953 0,9983 0,9994 0,9998 0,9999 1,0000
5,0
0,0067 0,0404 0,1247 0,2650 0,4405 0,6160 0,7622 0,8666 0,9319 0,9682 0,9863 0,9945 0,9980 0,9993 0,9998 0,9999 1,0000
5,1
0,0061 0,0372 0,1165 0,2513 0,4231 0,5984 0,7474 0,8560 0,9252 0,9644 0,9844 0,9937 0,9976 0,9992 0,9997 0,9999 1,0000
5,2
0,0055 0,0342 0,1088 0,2381 0,4061 0,5809 0,7324 0,8449 0,9181 0,9603 0,9823 0,9927 0,9972 0,9990 0,9997 0,9999 1,0000
5,3
0,0050 0,0314 0,1016 0,2254 0,3895 0,5635 0,7171 0,8335 0,9106 0,9559 0,9800 0,9916 0,9967 0,9988 0,9996 0,9999 1,0000
5,4
0,0045 0,0289 0,0948 0,2133 0,3733 0,5461 0,7017 0,8217 0,9027 0,9512 0,9775 0,9904 0,9962 0,9986 0,9995 0,9998 0,9999 1,0000
5,5
0,0041 0,0266 0,0884 0,2017 0,3575 0,5289 0,6860 0,8095 0,8944 0,9462 0,9747 0,9890 0,9955 0,9983 0,9994 0,9998 0,9999 1,0000
5,6
0,0037 0,0244 0,0824 0,1906 0,3422 0,5119 0,6703 0,7970 0,8857 0,9409 0,9718 0,9875 0,9949 0,9980 0,9993 0,9998 0,9999 1,0000
r
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
5,7
0,0033 0,0224 0,0768 0,1800 0,3272 0,4950 0,6544 0,7841 0,8766 0,9352 0,9686 0,9859 0,9941 0,9977 0,9991 0,9997 0,9999 1,0000
5,8
0,0030 0,0206 0,0715 0,1700 0,3127 0,4783 0,6384 0,7710 0,8672 0,9292 0,9651 0,9841 0,9932 0,9973 0,9990 0,9996 0,9999 1,0000
5,9
0,0027 0,0189 0,0666 0,1604 0,2987 0,4619 0,6224 0,7576 0,8574 0,9228 0,9614 0,9821 0,9922 0,9969 0,9988 0,9996 0,9999 1,0000
6,0
0,0025 0,0174 0,0620 0,1512 0,2851 0,4457 0,6063 0,7440 0,8472 0,9161 0,9574 0,9799 0,9912 0,9964 0,9986 0,9995 0,9998 0,9999 1,0000
6,1
0,0022 0,0159 0,0577 0,1425 0,2719 0,4298 0,5902 0,7301 0,8367 0,9090 0,9531 0,9776 0,9900 0,9958 0,9984 0,9994 0,9998 0,9999 1,0000
6,2
0,0020 0,0146 0,0536 0,1342 0,2592 0,4141 0,5742 0,7160 0,8259 0,9016 0,9486 0,9750 0,9887 0,9952 0,9981 0,9993 0,9997 0,9999 1,0000
6,3
0,0018 0,0134 0,0498 0,1264 0,2469 0,3988 0,5582 0,7017 0,8148 0,8939 0,9437 0,9723 0,9873 0,9945 0,9978 0,9992 0,9997 0,9999 1,0000
6,4
0,0017 0,0123 0,0463 0,1189 0,2351 0,3837 0,5423 0,6873 0,8033 0,8858 0,9386 0,9693 0,9857 0,9937 0,9974 0,9990 0,9996 0,9999 1,0000
6,5
0,0015 0,0113 0,0430 0,1118 0,2237 0,3690 0,5265 0,6728 0,7916 0,8774 0,9332 0,9661 0,9840 0,9929 0,9970 0,9988 0,9996 0,9998 0,9999 1,0000
6,6
0,0014 0,0103 0,0400 0,1052 0,2127 0,3457 0,5108 0,6581 0,7796 0,8686 0,9274 0,9627 0,9821 0,9920 0,9966 0,9986 0,9995 0,9998 0,9999 1,0000
6,7
0,0012 0,0095 0,0371 0,0988 0,2022 0,3406 0,4953 0,6433 0,7673 0,8596 0,9214 0,9591 0,9801 0,9909 0,9961 0,9984 0,9994 0,9998 0,9999 1,0000
6,8
0,0011 0,0087 0,0344 0,0928 0,1920 0,3270 0,4799 0,6285 0,7548 0,8502 0,9151 0,9552 0,9779 0,9898 0,9956 0,9982 0,9993 0,9997 0,9999 1,0000
6,9
0,0010 0,0080 0,0320 0,0871 0,1823 0,3137 0,4647 0,6136 0,7420 0,8405 0,9084 0,9510 0,9755 0,9885 0,9950 0,9979 0,9992 0,9997 0,9999 1,0000
7,0
0,0009 0,0073 0,0296 0,0818 0,1730 0,3007 0,4497 0,5987 0,7291 0,8305 0,9015 0,9467 0,9730 0,9872 0,9943 0,9976 0,9990 0,9996 0,9999 1,0000
7,1
0,0008 0,0067 0,0275 0,0767 0,1641 0,2881 0,4349 0,5838 0,7160 0,8202 0,8942 0,9420 0,9703 0,9857 0,9935 0,9972 0,9989 0,9996 0,9998 0,9999 1,0000
7,2
0,0007 0,0061 0,0255 0,0719 0,1555 0,2759 0,4204 0,5689 0,7027 0,8096 0,8867 0,9371 0,9673 0,9841 0,9927 0,9969 0,9987 0,9995 0,9998 0,9999 1,0000
7,3
0,0007 0,0056 0,0236 0,0674 0,1473 0,2640 0,4060 0,5541 0,6892 0,7988 0,8788 0,9319 0,9642 0,9824 0,9918 0,9964 0,9985 0,9994 0,9998 0,9999 1,0000
7,4
0,0006 0,0051 0,0219 0,0632 0,1395 0,2526 0,3920 0,5393 0,6757 0,7877 0,8707 0,9265 0,9609 0,9805 0,9908 0,9959 0,9983 0,9993 0,9997 0,9999 1,0000
7,5
0,0006 0,0047 0,0203 0,0591 0,1321 0,2414 0,3782 0,5246 0,6620 0,7764 0,8622 0,9208 0,9573 0,9784 0,9897 0,9954 0,9980 0,9992 0,9997 0,9999 1,0000
7,6
0,0005 0,0043 0,0188 0,0554 0,1249 0,2307 0,3646 0,5100 0,6482 0,7649 0,8535 0,9148 0,9536 0,9762 0,9886 0,9948 0,9978 0,9991 0,9996 0,9999 1,0000
7,7
0,0005 0,0039 0,0174 0,0518 0,1181 0,2203 0,3514 0,4956 0,6343 0,7531 0,8445 0,9085 0,9496 0,9739 0,9873 0,9941 0,9974 0,9989 0,9996 0,9998 0,9999 1,0000
7,8
0,0004 0,0036 0,0161 0,0485 0,1117 0,2103 0,3384 0,4812 0,6204 0,7411 0,8352 0,9020 0,9454 0,9714 0,9859 0,9934 0,9971 0,9988 0,9995 0,9998 0,9999 1,0000
7,9
0,0004 0,0033 0,0149 0,0453 0,1055 0,2006 0,3257 0,4670 0,6065 0,7290 0,8257 0,8952 0,9409 0,9687 0,9844 0,9926 0,9967 0,9986 0,9994 0,9998 0,9999 1,0000
8,0
0,0003 0,0030 0,0138 0,0424 0,0996 0,1912 0,3134 0,4530 0,5925 0,7166 0,8159 0,8881 0,9362 0,9658 0,9827 0,9918 0,9963 0,9984 0,9993 0,9997 0,9999 1,0000
8,1
0,0003 0,0028 0,0127 0,0396 0,0940 0,1822 0,3013 0,4391 0,5786 0,7041 0,8058 0,8807 0,9313 0,9628 0,9810 0,9908 0,9958 0,9982 0,9992 0,9997 0,9999 1,0000
8,2
0,0003 0,0025 0,0118 0,0370 0,0887 0,1736 0,2896 0,4254 0,5647 0,6915 0,7955 0,8731 0,9261 0,9595 0,9791 0,9898 0,9953 0,9979 0,9991 0,9997 0,9999 1,0000
8,3
0,0002 0,0023 0,0109 0,0346 0,0837 0,1653 0,2781 0,4119 0,5507 0,6788 0,7850 0,8652 0,9207 0,9561 0,9771 0,9887 0,9947 0,9977 0,9990 0,9996 0,9998 0,9999 1,0000
8,4
0,0002 0,0021 0,0100 0,0323 0,0789 0,1573 0,2670 0,3987 0,5369 0,6659 0,7743 0,8571 0,9150 0,9524 0,9749 0,9875 0,9941 0,9973 0,9989 0,9995 0,9998 0,9999 1,0000
r
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
8,5
0,0002 0,0019 0,0093 0,0301 0,0744 0,1496 0,2562 0,3856 0,5231 0,6530 0,7634 0,8487 0,9091 0,9486 0,9726 0,9862 0,9934 0,9970 0,9987 0,9995 0,9998 0,9999 1,0000
8,6
0,0002 0,0018 0,0086 0,0281 0,0701 0,1422 0,2457 0,3728 0,5094 0,6490 0,7522 0,8400 0,9029 0,9445 0,9701 0,9848 0,9926 0,9966 0,9985 0,9994 0,9998 0,9999 1,0000
8,7
0,0002 0,0016 0,0079 0,0262 0,0660 0,1352 0,2355 0,3602 0,4958 0,6269 0,7409 0,8311 0,8965 0,9403 0,9675 0,9832 0,9918 0,9962 0,9983 0,9993 0,9997 0,9999 1,0000
8,8
0,0002 0,0015 0,0073 0,0244 0,0621 0,1284 0,2256 0,3478 0,4823 0,6137 0,7294 0,8220 0,8898 0,9358 0,9647 0,9816 0,9909 0,9957 0,9981 0,9992 0,9997 0,9999 1,0000
8,9
0,0001 0,0014 0,0068 0,0228 0,0584 0,1219 0,2160 0,3357 0,4689 0,6006 0,7178 0,8126 0,8829 0,9311 0,9617 0,9798 0,9899 0,9952 0,9978 0,9991 0,9996 0,9998 0,9999 1,0000
9,0
0,0001 0,0012 0,0062 0,0212 0,0550 0,1157 0,2068 0,3239 0,4557 0,5874 0,7060 0,8030 0,8758 0,9261 0,9585 0,9780 0,9889 0,9947 0,9976 0,9989 0,9996 0,9998 0,9999 1,0000
9,5
0,0001 0,0008 0,0042 0,0149 0,0403 0,0885 0,1649 0,2687 0,3918 0,5218 0,6453 0,7520 0,8364 0,8981 0,9400 0,9665 0,9823 0,9911 0,9957 0,9980 0,9991 0,9996 0,9999 1,0000
10,0
0,0000 0,0005 0,0027 0,0103 0,0292 0,0670 0,1301 0,2202 0,3328 0,4579 0,5830 0,6967 0,7915 0,8644 0,9165 0,9512 0,9729 0,9857 0,9928 0,9965 0,9984 0,9993 0,9997 0,9999 1,0000
10,5
0,0000 0,0003 0,0018 0,0071 0,0211 0,0504 0,1016 0,1785 0,2794 0,3971 0,5207 0,6387 0,7419 0,8253 0,8879 0,9316 0,9604 0,9781 0,9885 0,9942 0,9972 0,9987 0,9994 0,9997 0,9999 1,0000
11,0
0,0000 0,0002 0,0012 0,0049 0,0151 0,0375 0,0786 0,1432 0,2320 0,3405 0,4599 0,5793 0,6887 0,7813 0,8540 0,9074 0,9441 0,9678 0,9823 0,9907 0,9953 0,9977 0,9989 0,9995 0,9998 0,9999 1,0000
11,5
0,0000 0,0001 0,0008 0,0034 0,0107 0,0277 0,0603 0,1137 0,1906 0,2888 0,4017 0,5198 0,6329 0,7330 0,8152 0,8783 0,9236 0,9542 0,9738 0,9857 0,9925 0,9962 0,9982 0,9991 0,9996 0,9998 0,9999 1,0000
12,0
0,0000 0,0000 0,0004 0,0022 0,0075 0,0203 0,0457 0,0894 0,1549 0,2423 0,3471 0,4615 0,5759 0,6815 0,7719 0,8443 0,8986 0,9370 0,9625 0,9786 0,9883 0,9939 0,9969 0,9984 0,9992 0,9996 0,9998 0,9999 0,9999
12,5
0,0000 0,0000 0,0003 0,0015 0,0053 0,0148 0,0345 0,0698 0,1249 0,2014 0,2970 0,4057 0,5189 0,6278 0,7250 0,8060 0,8693 0,9158 0,9481 0,9694 0,9826 0,9905 0,9950 0,9975 0,9988 0,9994 0,9997 0,9998 0,9999 1,0000
13,0
0,0000 0,0000 0,0002 0,0010 0,0037 0,0107 0,0259 0,0540 0,0997 0,1658 0,2517 0,3531 0,4631 0,5730 0,6751 0,7636 0,8355 0,8904 0,9301 0,9573 0,9750 0,9859 0,9923 0,9960 0,9980 0,9990 0,9995 0,9998 0,9999 1,0000
13,5
0,0000 0,0000 0,0001 0,0007 0,0026 0,0077 0,0192 0,0415 0,0790 0,1352 0,2112 0,3044 0,4093 0,5182 0,6233 0,7178 0,7975 0,8609 0,9084 0,9421 0,9649 0,9795 0,9885 0,9938 0,9968 0,9984 0,9992 0,9996 0,9998 0,9999 1,0000
14,0
0,0000 0,0000 0,0000 0,0004 0,0017 0,0054 0,0141 0,0315 0,0620 0,1093 0,1756 0,2599 0,3584 0,4644 0,5703 0,6693 0,7558 0,8271 0,8825 0,9234 0,9520 0,9711 0,9832 0,9906 0,9949 0,9973 0,9986 0,9993 0,9996 0,9998 0,9998 0,9999 1,0000
14,5
0,0000 0,0000 0,0000 0,0003 0,0012 0,0039 0,0104 0,0239 0,0483 0,0877 0,1448 0,2201 0,3110 0,4125 0,5175 0,6191 0,7111 0,7897 0,8529 0,9012 0,9362 0,9603 0,9762 0,9863 0,9923 0,9959 0,9978 0,9989 0,9994 0,9997 0,9998 0,9999 1,0000
15,0
0,0000 0,0000 0,0000 0,0002 0,0008 0,0028 0,0076 0,0180 0,0374 0,0698 0,1184 0,1847 0,2676 0,3632 0,4656 0,5681 0,6641 0,7488 0,8194 0,8752 0,9170 0,9469 0,9672 0,9805 0,9888 0,9938 0,9966 0,9982 0,9991 0,9995 0,9998 0,9999 1,0000
15,5
0,0000 0,0000 0,0000 0,0001 0,0006 0,0019 0,0055 0,0134 0,0288 0,0552 0,0961 0,1538 0,2282 0,3171 0,4154 0,5170 0,6154 0,7052 0,7824 0,8455 0,8943 0,9304 0,9558 0,9729 0,9840 0,9908 0,9949 0,9973 0,9986 0,9993 0,9996 0,9998 0,9999 1,0000
16,0
0,0000 0,0000 0,0000 0,0000 0,0003 0,0013 0,0039 0,0099 0,0219 0,0432 0,0773 0,1269 0,1930 0,2744 0,3674 0,4667 0,5659 0,6593 0,7423 0,8122 0,8681 0,9107 0,9417 0,9632 0,9776 0,9868 0,9924 0,9958 0,9977 0,9988 0,9993 0,9996 0,9998 0,9998 1,0000
16,5
0,0000 0,0000 0,0000 0,0000 0,0002 0,0009 0,0028 0,0073 0,0166 0,0337 0,0618 0,1040 0,1620 0,2357 0,3225 0,4180 0,5164 0,6120 0,6996 0,7757 0,8384 0,8877 0,9247 0,9513 0,9695 0,9815 0,9892 0,9938 0,9966 0,9982 0,9990 0,9995 0,9997 0,9998 0,9999 1,0000
17,0
0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0020 0,0054 0,0126 0,0261 0,0491 0,0846 0,1350 0,2008 0,2808 0,3714 0,4677 0,5640 0,6549 0,7363 0,8054 0,8614 0,9047 0,9367 0,9593 0,9747 0,9848 0,9911 0,9950 0,9972 0,9985 0,9992 0,9996 0,9998 0,9999 1,0000
17,5
0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0013 0,0038 0,0093 0,0200 0,0386 0,0683 0,1115 0,1697 02425 0,3274 0,4203 0,5159 0,6088 0,6944 0,7693 0,8317 0,8814 0,9192 0,9467 0,9660 0,9790 0,9874 0,9926 0,9958 0,9977 0,9987 0,9993 0,9996 0,9997 0,9998 0,9998 1,0000
18,0
0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0010 0,0028 0,0070 0,0153 0,0303 0,0548 0,0916 0,1425 0,2080 0,2866 0,3750 0,4686 0,5622 0,6508 0,7306 0,7990 0,8550 0,8988 0,9317 0,9553 0,9717 0,9826 0,9896 0,9940 0,9966 0,9981 0,9990 0,9994 0,9997 0,9999 0,9999 1,0000
18,5
0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0007 0,0020 0,0052 0,0116 0,0236 0,0437 0,0747 0,1188 0,1771 0,2490 0,3321 0,4225 0,5155 0,6060 0,6897 0,7635 0,8255 0,8754 0,9139 0,9423 0,9626 0,9764 0,9856 0,9915 0,9951 0,9972 0,9985 0,9992 0,9995 0,9997 0,9998 0,9999 1,0000
19,0
0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0015 0,0038 0,0088 0,0183 0,0346 0,0605 0,0984 0,1497 0,2148 0,2920 0,3783 0,4694 0,5606 0,6471 0,7255 0,7931 0,8490 0,8932 0,9268 0,9514 0,9687 0,9804 0,9881 0,9930 0,9960 0,9977 0,9988 0,9993 0,9996 0,9998 0,9999 1,0000
19,5
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0010 0,0027 0,0066 0,0140 0,0272 0,0486 0,0808 0,1256 0,1839 0,2549 0,3363 0,4245 0,5150 0,6033 0,6853 0,7579 0,8195 0,8696 0,9086 0,9379 0,9590 0,9738 0,9837 0,9901 0,9941 0,9966 0,9981 0,9989 0,9994 0,9996 0,9998 0,9998 1,0000
20,0
0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0007 0,0020 0,0049 0,0107 0,0213 0,0389 0,0661 0,1048 0,1564 0,2210 0,2970 0,3814 0,4702 0,5590 0,6436 0,7205 0,7874 0,8432 0,8877 0,9220 0,9474 0,9656 0,9781 0,9865 0,9918 0,9952 0,9972 0,9984 0,9991 0,9995 0,9997 0,9998 0,9999 1,0000
Tabela 5 - Distribuio t
0
v g. l. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 0,25 1,000 0,816 0,765 0,741 0,727 0,718 0,711 0,706 0,703 0,700 0,697 0,695 0,694 0,692 0,691 0,690 0,689 0,688 0,688 0,687 0,686 0,686 0,685 0,685 0,684 0,684 0,684 0,683 0,683 0,683 0,681 0,679 0,677 0,674
t
0,10 3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,315 1,314 1,313 1,311 1,310 1,303 1,296 1,289 1,282 0,05 6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,706 1,703 1,701 1,699 1,697 1,684 1,671 1,658 1,645 0,025 12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 2,056 2,052 2,048 2,045 2,042 2,021 2,000 1,980 1,960 0,01 31,821 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,479 2,473 2,467 2,462 2,457 2,423 2,390 2,358 2,326 0,005 63,657 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,779 2,771 2,763 2,756 2,750 2,704 2,660 2,617 2,576
Tabela 6 - Distribuio 2
g. l. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 0,995 0,00004 0,01003 0,07172 0,20699 0,41174 0,67573 0,98927 1,34419 1,73493 2,15585 2,60321 3,07382 3,56503 4,07468 4,60094 5,14224 5,69724 6,26481 6,84398 7,43386 8,03386 8,64272 9,26042 9,88623 10,5197 11,1603 11,8076 12,4613 13,1211 13,7867 20,7065 27,9907 35,5346 43,2752 51,1720 59,1963 67,3276 0,990 0,00016 0,02010 0,11483 0,29711 0,55430 0,87209 1,23904 1,64648 2,08791 2,55821 3,05347 3,57056 4,10691 4,66043 5,22935 5,81221 6,40776 7,01491 7,63273 8,26040 8,89720 9,54249 10,1957 10,8564 11,5240 12,1981 12,8786 13,5648 14,2565 14,9535 22,1643 29,7067 37,4848 45,4418 53,5400 61,7541 70,0648 0,975 0,00098 0,05064 0,21580 0,48442 0,83121 1,23735 1,68987 2,17973 2,70039 2,42697 3,81575 4,40379 5,00874 5,62872 6,26214 6,90766 7,56418 8,23075 8,90655 9,59083 10,2829 10,9823 11,6885 12,4011 13,1197 13,8439 14,5733 15,3079 16,0471 16,7908 24,4331 32,3574 40,4817 48,7576 57,1532 65,6466 74,2219 0,950 0,00393 0,10259 0,35185 0,71072 1,14548 1,63539 2,16735 2,73264 3,32511 3,94030 4,57481 5,22603 5,89186 6,57063 7,26094 7,96164 8,67176 9,39046 10,1170 10,8508 11,5913 12,3380 13,0905 13,8484 14,6114 15,3791 16,1513 16,9279 17,7083 18,4926 26,5093 34,7642 43,1879 51,7393 60,3915 69,1260 77,9295 0,050 3,84146 5,99147 7,81473 9,48773 11,0705 12,5916 14,0671 15,5073 16,9190 18,3070 19,6751 21,0261 22,3621 23,6848 24,9958 26,2962 27,5871 28,8693 30,1435 31,4104 32,6705 33,9244 35,1725 36,4151 37,6525 38,8852 40,1133 41,3372 42,5569 43,7729 55,7585 67,5048 79,0819 90,5312 101,879 113,145 124,342 0,025 5,02389 7,37776 9,34840 11,1433 12,8325 14,4494 16,0128 17,5346 19,0228 20,4831 21,9200 23,3367 24,7356 26,1190 27,4884 28,8454 30,1910 31,5264 32,8523 34,1696 35,4789 36,7807 38,0757 39,3641 40,6465 41,9232 43,1944 44,4607 45,7222 46,9792 59,3417 71,4202 83,2976 95,0231 106,629 118,136 129,561 0,010 6,63490 9,21034 11,3449 13,2767 15,0863 16,8119 18,4753 20,0902 21,6660 23,2093 24,7250 26,2170 27,6883 29,1413 30,5779 31,9999 33,4087 34,8053 36,1908 37,5662 38,9321 40,2894 41,6384 42,9798 44,3141 45,6417 46,9630 48,2782 49,5879 50,8922 63,6907 76,1539 88,3794 100,425 112,329 124,116 135,807 0,005 7,87944 10,5966 12,8381 14,8602 16,7496 18,5476 20,2777 21,9550 23,5893 25,1882 26,7569 28,2995 29,8194 31,3193 32,8013 34,2672 35,7185 37,1564 38,5822 39,9968 41,4010 42,7956 44,1813 45,5585 46,9278 48,2899 49,6449 50,9933 52,3356 53,6720 66,7659 74,4900 91,9517 104,215 116,321 128,299 140,169
Tabela 7 - Distribuio F - 1%
Tabela 7 - Distribuio F - 5%