Estatística Basica - Leandro
Estatística Basica - Leandro
Estatística Basica - Leandro
Ano: 2024
Sumário
1 Conceitos básicos
1.1 População x Amostra
1.2 Censo x Amostragem
1.3 Dado x Variável
1.4 Parâmetros x estatísticas
1.5 Arredondamento de dados
1.6 Fases do método estatístico
2 Representação tabular
2.1 Representação esquemática
2.2 Elementos de uma tabela
2.3 Séries estatísticas
2.4 Distribuição de frequência
3 Representação gráfica
3.1 Gráficos de Linhas
3.2 Gráficos de colunas ou barras
3.3 Gráficos circulares ou de Setores (Pie Charts)
3.4 Gráfico Pictorial - Pictograma
3.5 Gráfico Polar
3.6 Cartograma
3.7 Gráficos utilizados para a análise de uma distribuição de frequência
4 Medidas descritivas
4.1 Medidas de posição
4.2 Medidas de variabilidade ou dispersão
4.3 Medidas de dispersão relativas
4.4 Momentos, assimetria e curtose
4.5 Exercícios
6 Distribuições de Probabilidade
6.1 Distribuições discretas de probabilidade
6.2 Exercícios
6.2 Distribuições contínuas de probabilidade
6.4 Exercícios
7 Amostragem
7.1 Conceitos em amostragem
7.2 Planos de amostragem
6.3 Tipos de amostragem
7.4 Amostragem com e sem reposição
7.5 Representação de uma distribuição amostral
7.6 Distribuições amostrais de probabilidade
7.7 Exercícios
7.8 Estatísticas amostrais
7.9 Tamanho da amostra
8 Estimação de parâmetros
8.1 Estimação pontual
8.2 Estimação intervalar
8.3 Exercícios
9 Testes de hipóteses
9.1 Principais conceitos
8.2 Teste de significância
9.3 Exercícios
9.4 Testes do Qui-quadrado
9.5 Exercícios
10 Regressão e Correlação
10.1 Introdução
10.2 Definição
10.3 Modelo de Regressão
10.4 Método para estimação dos parâmetros α e β
10.5 Decomposição da variância Total
10.6 Análise de Variância da Regressão
10.7 Coeficiente de Determinação (r²)
10.8 Coeficiente de Correlação (r)
10.9 Exercícios
11 Referências bibliográficas
1. Conceitos Básicos
Uma população pode, mediante processos operacionais, ser considerada infinita, pois a mesma irá
depender do tamanho da amostra. Se a frequência relativa entre amostra e população for menor do
que 5% ela é considerada infinita, se a frequência relativa for maior do 5% ela é considerada finita.
1
• Variável: É aquilo que se deseja observar para se tirar algum tipo de conclusão,
geralmente as variáveis para estudo são selecionadas por processos de amostragem.
Os símbolos utilizados para representar as variáveis são as letras maiúsculas do
alfabeto, tais como X, Y, Z, ... que pode assumir qualquer valor de um conjunto de
dados. As variáveis podem ser classificadas dos seguintes modos:
- Qualitativas (ou atributos): São características de uma população que não
pode ser medidas.
Discretas: são aquelas variáveis que pode assumir somente valores inteiros num
conjunto de valores. É gerada pelo processo de contagem, como o número de
veículos que passa em um posto de gasolina, o número de estudantes nesta sala
de aula. Contínuas: são aquelas variáveis que podem assumir um valor dentro de
um intervalo de valores. É gerada pelo processo de medição. Neste caso serve
como exemplo o volume de água em um reservatório ou o peso de um pacote de
cereal.
2
1.5 Arredondamento de Dados
3a) Se o primeiro algarismo após aquele que formos arredondar for 5, seguido
apenas de zeros, conservamos o algarismo se ele for par ou aumentamos
uma unidade se ele for ímpar, desprezando os seguintes.
Ex.: 6,2500 (para décimos) → 6,2 12,350 (para
décimos) → 12,4
Se o 5 for seguido de outros algarismos dos quais, pelo menos um é diferente de zero, aumentamos
uma unidade no algarismo e desprezamos os seguintes.
Ex.: 8,2502 (para décimos) → 8,3 8,4503 (para
décimos) → 8,5
3
17% + 18% + 12% + 31% + 22% = 100%
b) Planejamento
Determinar o procedimento necessário para resolver o problema:
4
Gráfica (apresentação geométrica)
2. Representação tabular
Título
Cabeçalho
Corpo
Rodapé
2.2 Elementos de uma tabela
5
• Casa ou célula: parte da tabela formada pelo cruzamento de uma linha com uma
coluna.
• Rodapé: É o espaço aproveitado em seguida ao fecho da tabela, onde são colocadas
as notas de natureza informativa (fonte, notas e chamadas).
• Fonte: refere-se à entidade que organizou ou forneceu os dados expostos.
• Notas e Chamadas: são esclarecimentos contidos na tabela (nota - conceituação geral; chamada -
esclarecer minúcias em relação a uma célula).
2.3 Séries Estatísticas
Anos Produção
1976 9 702
1977 9 332
1978 9 304
1979 9 608
1980 10 562
Fonte: Conjuntura Econômica (fev. 1983)
Região Populaçã
o
Norte 3 037
Nordeste 17 568
Sudeste 42 810
Sul 11 878
Centro- 5 115
Oeste
6
Total 80 408
Fonte: Anuário Estatístico (1984)
Localizaçã População
o
Urbana 80 408
Rural 38 566
Total 118 974
Fonte: Anuário Estatístico (1984)
REGIÕES
Anos
N NE SE S CO
1940 406 3 7 1 271
381 232 591
1950 581 4 10 2 424
745 721 313
1960 958 7 17 4 1 007
517 461 361
1970 1 11 28 7 2 437
624 753 965 303
1980 3 17 42 11 5 115
037 567 810 878
Fonte: Anuário Estatístico (1984)
7
2.4 Distribuição de Frequência
Xi fi
6.3 2
8.4 3
5.3 2
9.5 3
6.5 5
Σ 15
Fonte: Departamento de Estatística (1990)
Altura (cm) Xi fi
150 |--- 15 154 18
8
158 |--- 16 162 25
6
166 |--- 17 170 20
4
8
174 |--- 18 178 52
2
182 |--- 19 186 30
0
190 19 194 15
8
---- 160
Fonte: Departamento de Estatística (1990)
Para determinar o número de classes a partir dos dados não tabelados, podemos
usar a Fórmula de Sturges, mas deve-se saber que existem outros métodos de
determinação do número de classes em uma tabela de frequência. O que se deseja
fazer é apenas comprimir um conjunto de dados em uma tabela, para facilitar a
visualização e interpretação dos mesmos.
n(K) = 1+ 3.3 log n , onde “n” é no de informações.
Além da Regra de Sturges, existem outras fórmulas empíricas para resolver o problema para
determinação do número de classes [n(k)], há quem prefira n(k) ≅ n . Entretanto, a verdade é que
essas fórmulas não nos levam a uma decisão final; esta vai depender na realidade de um julgamento
pessoal, que deverá estar ligado a natureza dos dados, procurando, sempre que possível, evitar
classes com frequências nulas ou frequências relativas exageradamente grandes.
h = ln −ln−1 ou h = Ln − Ln−1
A amplitude do intervalo de classe deve ser constante em todo a distribuição de frequências
intervalar.
9
Amplitude total (H): É a diferença entre o limite superior da última classe e o
limite inferior da 1ª classe, ou a diferença entre último e o primeiro elemento de um
conjunto de dados postos em ordem crescente.
H = Ln −l1
Ponto médio de classe (Xi): É a média aritmética simples do limite inferior com o
limite superior de uma mesma classe.
li + Li
X i=
2
Quando substituirmos os intervalos de classes pelos pontos médios (X i), ter-se-á uma distribuição
de frequência pontual.
n =∑fi = f1 + f2 +...+f n
i=1
Fn = ∑f = ni
i=1
∑f i i=1
i=1
10
Frequência Relativa Acumulada (Fri): É o somatório da frequência relativa da i-
ésima classe com as frequências relativas das classes anteriores.
n
Frn =∑fri =1
i=1
3 Representação gráfica
10500
10000
Produção
9500
9000
8500
1976 1977 1978 1979 1980
Anos
11
45000
40000
35000 NE
30000 N
25000 SE
20000 S
CO
15000
10000
5000
0
1940 1950 1960 1970 1980
Fonte: Anuário
Estatístico (1984)
As larguras das barras que deverão ser todas iguais podendo ser adotado qualquer dimensão, desde
que seja conveniente e desde que não se superponham. O número no topo de cada barra pode ou não
omitido, se forem conservados, a escala vertical pode ser omitida.
12
45000
40000
35000 N
30000 NE
25000 SE
20000 S
15000
CO
10000
5000
0
1940 1950 1960 1970 1980
As regras usadas para o gráfico de barras são iguais as usadas para o gráfico de
colunas.
S 11878
Regiões SE 42810
NE 17568
N 3037
Assim como os gráficos de Colunas podem ser construídos gráficos de barras comparativas.
13
- A área do gráfico equivale à totalidade de casos (360o = 100%);
- Cada “fatia” representa a percentagem de cada categoria
32%
Urban
a
Rural
68%
Fonte: Anuário
Estatístico (1984)
Tem por objetivo despertar a atenção do público em geral, muito desses gráficos
apresentam grande dose de originalidade e de habilidade na arte de apresentação dos
dados.
1500
1250
1000
750
500
250
0
1968 1974 1980 1986 1990 1994
14
Evolução da frota nacional de carros à álcool de 1979 à 1987
Pinus
6 ,8%
Eucalipto
Madeira 24 ,4%
nativa
68 ,8%
15
É o tipo de gráfico ideal para representar séries temporais cíclicas, ou seja, toda
a série que apresenta uma determinada periodicidade.
Média = 237,31 mm
16
3.6 Cartograma
Exemplo:
População da Região Sul do Brasil – 1990 Densidade populacional da Região Sul do Brasil – 1990
Fonte: IBGE
Fonte: IBGE
17
3.7 Gráficos utilizados para a análise de uma distribuição de frequência
3.7.1 Histograma
Fonte: Departamento
de Estatística (1990)
3.6.3 Ogivas
18
3.7.4 Gráfico em segmentos de reta vertical
Características:
- Cada barra representa a frequência do intervalo
respectivo; - Os intervalos devem ter a mesma amplitude; -
As barras devem estar todas juntas.
A simples observação da forma Figura 4.1 Histograma
do histograma permite algumas
conclusões.
Veja a figura 4.1. A medida dos dados está 60 no centro do
desenho. As frequências mais altas também 50 estão no
centro da figura. Nos processos industriais, 40 esta é a
forma desejável. 30
20
10
0
19
A figura 4.2 apresenta um Figura 4.2 Histograma com assimetria
histograma com assimetria positiva. A positiva
média dos dados está localizada à 60
esquerda do centro da figura e a cauda à 50
direita é alongada. Esta ocorre quando o 40
limite inferior é controlado ou quando 30
não podem ocorrer valores abaixo de 20
determinado limite. 10
0
20
frequências são baixas no centro da figura, 60 mas existem
dois picos fora do centro. Esta forma 50 ocorre
quando duas distribuições com médias bem 40 diferentes se
misturam. Podem estar misturados, por 30 exemplo, os
produtos de dois turnos de trabalho. 20
10
0
Frequência Frequência
60 60
50 50
40 40
30 30
20 20
10 10
0 0
21
fant. + 2fi + fpost. fc i =
4
onde:
Quando for em fazer o uso da curva polida convém mostrar as frequências absolutas, por
meio de um pequeno circulo, de modo que qualquer interessado possa julgar se esse ponto
se o ponto é um dado original ou um dado polido.
22
Altura em centímetros de 40 alunas do Curso de Enfermagem da UFSM
- 1996
a) Curva simétrica
b) Curvas assimétricas
31
a direita é chamada assimétrica positiva ou enviesada à direita, se a
cauda se alonga a esquerda, a curva é chamada assimétrica negativa
ou enviesada à esquerda.
32
4 Medidas Descritivas
Média Aritmética
Representativas - Médias Média Geométrica
Média Harmônica
Mediana
Separatrizes Quartis
Decis
Centis ou Percentis
n N
∑X i ∑X i
33
X= i=1 ou m=
i=1 n N
Dados Tabelados com Valores Ponderados
X
Média Aritmética Ponderada ( w ), (onde Wi é o peso)
Xw = i=1 n
Notas Pesos
∑W i (Xi) (Wi)
i=1
7.8 2
8.3 3
8.2 2
5.8 3
Σ 10 Fonte: Dados Hipotéticos
Distribuição de frequências
34
Altura (cm) Xi fi Xi . fi
150 |--- 15 154 18 2763,0
8
158 |--- 16 162 25 4037,5
6
166 |--- 17 170 20 3390,0
4
174 |--- 18 178 52 9230,0
2
182 |--- 19 186 30 5565,0
0
190 19 194 15 2917,55
8
---- 16 27903
0
X= i=1n
∑f i
i=1
35
3a) Somando-se ou subtraindo-se todos os valores (Xi) da série por
uma constante "k" (k ≠ 0), a nova média aritmética será igual a
média original somada ou subtraída por esta constante "k".
xi yi = x i ± k
⇓ ⇓
X Y=X±k
n
Xg= n ∏X
i =1
i =n X1.X2 . ... .X n
Dados Tabelados
n n
∑ f n ∑ f
n1
) 1 ∑
(f1.logX1+f2.logX2+...+fn.logXn n
n
fi.logXi
36
Xg =10i=1 =10i=1
c) Média Harmônica (Xh)
=
Xh n n = n
1 1 + 1 + ... + 1
∑ i=1 Xi X1 X2 Xn
Dados Tabelados
n
X h= ∑∑ ni=1
f
f ii = f1 f1++ ff22 ++......++f
i= 1 Xi X1 X2 Xn
37
a) Dados não tabelados
i=1 1 ≤ i ≤ 3
se for mediana S =2 se for quartis S = 4
1 ≤ i ≤ 9 1 ≤ i ≤ 99
se for decis =10 se for centis S =100 S
Dados Tabelados
S i = l Si + S
f Si
onde:
Si = Md⇒ i =1; Si
= Qi ⇒ 1≤ i ≤ 3;
Si = Di ⇒ 1≤ i ≤ 9;
Si = Ci ou Pi ⇒ 1≤ i ≤ 99
⇒ limite inferior da classe que contém a separatriz;
lSi
i.n
⇒ posição da separatriz;
S
⇒ frequência acumulada da classe anterior a que contém a separatriz;
Fant
38
h ⇒ amplitude do intervalo de classe;
⇒ frequência absoluta da classe que contém a separatriz;
fSi
4.1.4 Emprego da mediana
Ex.: 3 4 4 4 5 5 6 6 7 8 ⇒ Mo = 4 (unimodal)
9
5 6 7 8 9 10 11 12 ⇒ Mo = ∃/ (amodal)
13
1 1 2 2 3 3 3 4 5 5 ⇒ Mo1 = 3 Mo2 = 5
5 (bimodal)
5 5 6 6 7 7 8 8 ⇒ Mo = ∃/ (amodal)
5 5 6 6 7 7 8 ⇒ Mo1 = 5 Mo2 = 6 Mo3 = 7 (multimodal)
Mo b = Xi
39
- Moda de Czuber (Moc): O processo para determinar a moda
usado por Czuber leva em consideração as frequências anteriores e
posteriores à classe modal.
⇒
∆1 .h ∆∆21 == ffMoMo −−ffantpos
Moc = lMo + ∆1 +∆2
onde:
l
Mo ⇒ limite inferior da classe
f
modal; Mo ⇒ frequência absoluta
da classe modal;
h ⇒ amplitude do intervalo de classe;
f
ant ⇒ frequência absoluta da classe anterior a classe
f
modal; pos ⇒ frequência absoluta da classe posterior
a classe modal;
Mop = 3 Md - 2 X
40
Um distribuição é considerada simétrica quando X ≡ Md ≡ Mo .
x = Md = Mo → curva simétrica
x =Md =Mo
M od a
M ed ian a
M é di a
Mo Md x x Md Mo
4.1.8 Exercícios
41
1)
3 7 8 10 12 13 15 17 18 21
4 6 8 11 13 14 17 18 19 22 25
2)
Alturas dos alunos da
Turma “X” no 1o sem. de
1994 - UFSM
Alturas fi
63 15
75 25
84 30
91 20
Σ 90
Fonte: Dados Hipotéticos
3)
Alturas dos alunos da
Turma “Y” no 1o sem. de
1994 – UFSM
Alturas fi Fi
61 |--- 65 12 12
65 |--- 69 23 35
69 |--- 73 34 69
73 |--- 77 26 95
77 |--- 81 15 11
0
Σ 11 11
0 0
Fonte: Dados Hipotéticos
42
As medidas de dispersão podem ser:
TAREFAS 1 2 3 4
OPERÁRIO 1 55 45 52 48
(TEMPO)
OPERÁRIO 2 (TEMPO 30 70 40 60
- Análise Gráfica
H=Xmax−Xmin
43
médio ∑ X − X = 0, assim ficando:
n
i
i=1
∑ n
i 1
Xi − X
X1 − X + X2 − X +...+ Xn − X
d= = =
n n
( )
d =∑i=n1 fi nX i − X = f1 X1 − X + f2 X2 n− X + ... + f n X n − X
∑ f∑ i fi i=1 i=1
) 2 n n
Xi −X
S 2 =∑i=n1 ( ) = (X −X) +(X −X) +...+(X
2 1
2
2
2
n −X)2
n−1 n−1
2 ∑ f (X
n i i − X )2 1( 1 ) 2 2( 2 ) 2 n ( n ) 2
−
s= i=1 n =fX−X+f X n X +... + f X−X
44
∑ fi ∑ fi i=1 i=1
∑ fi −1 ∑ fi −1
i=1 i=1
∑ (X −X )
n
2
s = i =1
i
=
(X 1
− X ) +(X 2 −X ) +... +(X n −X )
2 2 2
n n
∑ (X −X )
n
2
S= i =1
i
=
(X 1
− X ) +(X 2 −X ) +... +(X n −X )
2 2 2
n −1 n −1
∑ f (X −X )
n
2
f 1 (X 1 −X ) + f 2 (X 2 −X ) +... + f n (X n −X )
i i 2 2 2
i =1
s = n
= n
∑f i ∑f i
i =1 i =1
∑ f (X −X )
n
2
f1 (X 1 −X ) + f 2 (X 2 −X ) +... + f n (X n −X )
i i 2 2 2
i =1
S= n
= n
∑f i
−1 ∑f i
−1
i =1 i =1
- Propriedades da Variância
45
2ª) Multiplicando-se ou dividindo-se por uma constante k cada valor observado a
variância ficará multiplicada ou dividida pelo quadrado dessa constante.
σˆ =
R d2
n 2 3 4 5 6 7 8 9 10 11 12 13 14
d2 1,12 1,693 2,05 2,32 2,534 2,70 2,84 2,97 3,078 3,17 3,258 3,33 3,40
8 9 6 4 7 0 3 6 7
n 15 16 17 18 19 20 21 22 234 24 25 --- ---
d2 0,34 3,532 3,53 3,64 3,689 3,73 3,77 3,81 3,858 3,39 3,391 --- ---
7 2 0 5 8 9 1
Fonte: Montgomery, D.C. Statical Quality Control. Nova York, Wyley. 1991.
- Variância relativa
Relativ
a
- Coeficiente de Variação (Pearson)
46
comparação entre dois conjuntos de dados em termos percentuais, esta
comparação revelará o quanto os dados estão próximos ou distantes da
média do conjunto de dados.
- Variância Relativa
V.R.=σ22 ou S22 µ
X
σ S
C.V. = ou x 100 µ
X
4.4.1 Momentos
∑X r
m r= i
, para dados não
n tabelados;
47
∑X r
f para dados
m r= i i , tabelados.
∑f i
onde:
r é um número inteiro
positivo; m0 = 1; m1 =
média aritmética.
∑(X − X) ∑d
i
r r
i
M r=
∑f i n
onde: M0 = 1;
M1 = 0;
M2 = variância (s2).
αr = Mr
sr
onde: s = desvio padrão.
4.4.2 Assimetria
48
da curva representativa da distribuição considerada, logo a curva será
analisada quanto à sua assimetria.
X ≡ Mo ≡ Md
Assimétrica
Negativa
Assimétrica
Positiva
X<
Md <
Mo
Podemos medir a assimetria de uma distribuição, calculando os
coeficientes de assimetria. Sendo o mais utilizado o Coeficiente de
Assimetria de Pearson.
As = X − Mo
S
As= Q3 +Q1−2Md
49
Q3− Q1
α3 = Ms33
- Intensidade da
assimetria:
4.4.3 Curtose
50
- Coeficiente de Curtose
K= Q3 −Q1
2(P90 −P10)
α4 = Ms44
Interpretação:
- Se α4 = 3 ⇒ curva Mesocúrtica;
4.5 Exercícios
51
mediana e moda de czuber), dispersão (desvio padrão e variância,
coeficiente de variação de Pearson), assimetria (coeficiente de
assimetria, e coeficiente de curtose). Faça um relatório referente ao
comportamento dos dados em função dos resultados obtidos.
4,0 4,2 4,3 4,4 4,5 4,5 4,6 5,0 5,1 5,2
5,3 5,3 5,5 5,7 5,8 6,0 6,1 6,3 6,4 6,5
6,6 6,7 6,8 6,9 7,0 7,2 7,5 7,6 7,7 7,9
8,0 8,3 8,5 8,6 8,8 8,9 9,0 9,1 9,2 9,3
9,3 9,4 9,4 9,5 9,5 9,6 9,7 9,8 9,9 10,0
153 154 155 156 158 160 160 161 161 161
162 162 163 163 164 164 165 166 167 167
168 168 169 169 170 170 170 171 171 172
172 173 173 174 174 175 175 176 177 178
179 179 180 182 183 184 185 186 186 187
188 188 189 189 190 191 192 192 192 192
193 194 194 195 197 197 199 200 201 205
50,0 52,5 53,5 54,0 54,2 55,5 56,3 56,50 57,0 58,1
0 0 0 0 0 0 0 0 0
58,5 59,0 60,3 61,5 62,0 62,9 63,5 64,00 64,3 65,0
0 0 0 0 0 0 0 0 0
66,0 66,2 67,5 68,0 68,7 69,5 70,0 72,00 75,0 76,5
0 5 0 0 0 0 0 0 0
77,0 78,0 80,0 81,5 82,5 83,5 85,0 87,30 88,0 89,1
0 0 0 0 0 0 0 0 0
90,0 91,3 92,1 93,2 94,0 95,2 96,0 97,00 98,0 99,8
0 5 0 0 0 5 0 0 0
100,1 100,2 101,0 102,0 103,4 104,3 105,0 107,0 108,0 109,1
0 0 0 0 0 0 0 0 0 0
52
5 Probabilidade e Variáveis
Aleatórias
53
5.2.1 Experimento aleatório (W)
Qualquer processo aleatório, capaz de produzir observações, os
resultados surgem ao acaso, podendo admitir repetições no futuro. Um
experimento aleatório apresenta as seguintes características:
5.2.2.1 Finito
Número limitado de elementos;
Ex.: S = {1, 2, 3, 4, 5, 6}
5.2.2.2 Infinito
Número ilimitado de elementos, pode ser sub-dividido em:
a - Enumerável
Quando os possíveis resultados puderem ser postos em
concordância biunívoca com o conjunto dos números naturais (N) (caso
das variáveis aleatórias discretas).
Ex.: N
b - Não Enumerável
Quando os possíveis resultados não puderem ser postos em
concordância biunívoca com o conjunto dos números naturais (caso das
variáveis aleatórias contínuas).
Ex.: R
54
5.2.3 Evento (E)
Um evento (E) é qualquer subconjunto de um espaço amostral
(S).
Pode-se ter operações entre eventos da mesma forma que com
conjuntos, como mostra a seguir.
5.2.4.1 A união B
Símbolo utilizado "", é o evento que ocorrerá se, e somente se, A
ou B ou ambos ocorrerem;
A B
5.2.4.2 A interseção B
AU B
A B
55
5.2.4.3 Complementar de A
_
56
FIGURA 6.5 - Evento não excludentes
logo,
S = { 1, 2, 3, 4 } A = {1, 2 } B= A B = { 2
{ 2, 4 } }
57
na ocorrência de outro.
( )
P AB = P(AP(B)B)
ABCD =∅
FIGURA 6.6 - Evento coletivamente exaustivos
58
Uma possível maneira de tratar a questão seria determinar a
frequência relativa do evento E (fr(E)),
a
P(E) = ,
a+b
59
a - 0 ≤ P(E) ≤ 1; b - P(S) = 1; c - Se A e B
são eventos mutuamente excludentes,
então:
P(A B) = P(A) + P(B).
P(A) = P(A ∅)
P(A) = P(A) + P(∅)
P(∅) = P(A) - P(A)
P(∅) = 0.
_ _
_ _
60
Prova: A A = S, mas A e A são mutuamente excludentes, então:
P(A A) = P(S)
_ _
P(A) + P(A ) = 1
logo,
_
P(A) = 1 - P(A).
(A B) = A (B A )
e
_
B = (A B) (B A )
61
logo pela propriedade (c) temos:
P(A B) = P[A (B A )]
_
()
P(A B) = P(A) + P(B
A) e
_
Decorrências do Teorema 3:
P(A B C) = P[(A B) C]
n n n
62
i=1 i<j=2 i< j<k=3
−
∑P(A A
i j Ak A)+...+(−1)n−1P(A1 A 2 ...A n).
i<j<k<=4
RESUMO
+ (OU) Quaisquer ⇒ P(A B) = P(A)+ P(B) - P(A B)
A B ≠ ∅
63
5.4 Exercícios
64
a) se ela tiver olhos castanhos, qual a probabilidade de também ter
cabelos castanhos?
b) se ela tiver cabelos castanhos, qual a probabilidade de ter olhos
castanhos ? (3/5) (3/8)
65
12) A probabilidade de um aluno resolver um determinado
problema é de 1/5 e a probabilidade de outro é de 5/6. Sabendo
que os alunos tentam solucionar o problema independentemente.
Qual a probabilidade do problema ser resolvido :
a)somente pelo primeiro ?
b)ao menos por um dos alunos ?
c) por nenhum ?
Ai ≠∅, i = 1, 2, ..., k
k
A i =S,
i=1
Ai A j =∅, i ≠ j
B = (B A1) (B A2 ) ... (B A k )
66
B
P(B) =∑k P(A j ).P
, j = 1, 2, ..., k ( ) j=1 A j
P(B A i) = P(Ai ).P BAi , ()
como
j=1 .P A
Exemplo:
Urna U1 U2 U3
Azul 3 4 3
Cores
Branca 1 3 3
Preta 5 2 3
Escolhe-se uma urna ao acaso e dela extrai-se uma bola ao acaso,
verificando-se que
ela é branca. Qual a probabilidade dela ter saído da urna:
U1 ? U2 ? U3 ?
67
Qual a probabilidade de que tenha saído da primeira caixa ? segunda
caixa ?
68
de probabilidade, representada por P(X = x) ou P(x).
∑P(X ) =1
i
i=
69
1a) F(X) = ∑ (x )P
i
xi ≤x
( )
xlim→x0 F(X) ≠ F Xo , para P(X= xo) ≠ 0
Definição: Seja X uma V.A.D., com valores possíveis x1, x2, ...,
xn,... ; Seja P(xi) =
P(X = xi), i = 1, 2, ..., n, ... . Então, o valor esperado de X (ou Esperança
Matemática de X), denotado por E(X) é definido como
E(X) = ∑x P(x )
i i
i=1
∞ ∞
<∞, este
i=1 i=1
70
∞
=
V(X) ∑(x − E(X)) .P(x ) ou V(X) = E(X ) − E(X)
i
2
i
2 2
i=1
∞
P(a ≤ x ≤ b) = ∫ f(x) dx
b
71
Definição: A função f(x) é uma Função Densidade de
Probabilidade (f.d.p.) para uma V.A.C. X, definida nos
reais quando
f(x) ≥ 0;
f(x) dx = 1;
P(a ≤ x ≤ b) = ∫a
b
f(x) dx .
F(X) dx
P(a≤x≤b)=P(a<x<b)=P(a<x≤b)=P(a≤x<b)
E(X) x.f(x) dx
x | f(x) for
finita.
5.7.8 Variância de uma V.A.C.
72
Definição: Seja X uma V.A.C. de uma função distribuição de
probabilidade (f.d.p.). A variância de X é:
E(X)
V(X) ) f(x) dx ou V(X) = E(X ) − E(X)
2 2 2
onde
E(X2 ) f(x) dx
5.8 Exemplos
i) Representação gráfica
0 ,6
0,5
0,4
0,3
0,2
0,1
0
0 1 2
73
ii) Rep
res
ent
açã
o
gráfica
F(x) = 0 se x<0
F(X) = 1 se x ≥ 2
ii
i)
a) P
P
b)
c) P
d) F(1) = 3/4 e) F(2) = 1
E(X)
=
∑x P(x ) = 0 .
i i +1 . +2 . =1
i=1
Variância 2
) =∑∞ x2i P(xi )=
02 12 22
.+ .+ . 41 64
74
E(X=
i=1
1 3 1
iii) Determine P ≤x≤ eP ≤x<1
4 4 4
iv)E(X) e V(X)
i)
i
i)
−∞
para 0 ≤ x < 1 ⇒ F
75
para x ≥ 1 ⇒ F
Representação gráfica
iii) P
∫
iv) E(X)
= ∫ 0
1
x f(x) dx 2x dx f(x)
dx = 23 [ ]
3 10 = 23 x
E(X )
2
f(x) dx 2x dx= f(x) dx =
2
4 [x ]
4
10=
1
2
logo,
1 2 2 9 −8 1
V(X) = E(X ) −[E(X)] =
2 2
2 − 3 = 18 = 18
5.9 Exercícios
76
a)Determine sua função de repartição e represente graficamente.
b)Calcule usando as propriedades:
b.1) a) P(1 < x < 3); b) P(1 ≤ x ≤ 2); c) P(1 < x ≤ 3); d) F(1); e)
F(2)
c) E(X) e V(X)
i) W = X -
Y ii) A =
2 Y iii) Z
=X.Y
P X =
( ) K
x para x = 1, 3, 5 e 7
77
c) E(X) d) V(X)
0, caso contrário
i) Ache a função de repartição e esboce o gráfico.
ii) Determine E(X) e V(X).
6)Seja f(x) = 12 x, 0 ≤ x ≤ 2 ,
0, caso contrário
i) Ache a função de repartição e esboce o gráfico.
ii) P(1< x < 1,5).
iii) E(X) e V(X).
78
6x(1− x), 0 < x <1
8) A função de probabilidade de uma V.A.C. X é f(x) =
0, caso contrário
a) Determine F(X) e represente graficamente.
1
P x≤
b)Calcule 2
c) E(X) e V(X)
9) Uma variável aleatória X tem a seguinte f.d.p.:
f(x) = 0 x < 0 f(x) = Ax 0 ≤
x < 500
f(x) = A(100 - x) 500 ≤ x < 1000
f(x) = 0 x ≥ 1000
a) Determine o valor de A.
b)P (250 ≤ x ≤ 750).
P − 1 ≤ x≤ 1
a) Calcule: 2 2 , b) P(X = 0)
79
6 Distribuições de Probabilidade
ou ainda:
80
P(AA...AAA...A) = P(A).P(A). ... . P(A).P(A).P(A). ... . P(A)
_ P(A).P(A).
P(X = x) = px.qn−x.
E(X) = ∑x P(x )i i
i=1
onde
∞
E(X2)
E(X2) = 0.q + 1.p = p
logo
V(X) = p− p2
V(X) = p.(1-p)
81
V(X) = p . q
82
E(X) = ∑x P(x )
i i
i=1
n x q n−x
E(X) = x.xp como P(X) segue uma
∑ ∞
= P(X = xi ) =1 ou ∑ ∞
nx xq
n−x =1 p
i1
logo,
= n. s p
x=1
∑ ∞
n -1 s . q (n−1)−s
x =1
1
E(X) = n . p
83
6.1.2.2 Variância de uma Distribuição Binomial
onde
∞
n!
E(X2) = x.x ∑∞
q
x n−x
, para s= x -1 e x =
s+1, temos: p
x.(x−1)!(n −x)! x=1
n!
E(X2) = (s+1) ∑ ∞
ps+1qn−(s+1)
s!(n− (s+1))! x=1
E(X2) = n.p(n−1)p +1
E(X2) = n.p(np −p +1
E(X2) = n2p2 − np2 + np
V(X) = n2p2 − np2 + np - (np)2
V(X) = n.p.(1- p)
V(X) = n. p.q
84
E(p) = p e V(p) =
p.q
n
6.1.3 Distribuição de Poisson
n! x
P(x) = nx pxqn−x .
x!
=
Se p → 0 e n >> x logo, q n−x ≈ qn (1− p) n
assim,
P(x) = (n.p)x(1− p)n
x!
85
P(x) ≅ (n.p) x
1− n.p +
(n.2p!)2 +... x!
(n.p) xe-n.p
P(x) =
x!
Substituindo o valor esperado n.p por λ e considerando-o como
sendo o número médio de ocorrência expresso em unidades de tempo,
pode-se dizer que λ é a taxa média de falhas (falha / unid. tempo) e t o
tempo, logo o número médio de falhas será λt, assim,
P(x) =
λxt . e-λ
x!
fornece a probabilidade de x falhas no período de tempo t.
E(X) xi P(xi )
i=1
= ∑ ∞
x e-λλx E(X)
x=1 x!
∞ e-λλx
E(X) =∑ , substituindo s = x -1 e x = s + 1 temos:
x=1 (x-1)!
∞
E(X) = ∑ e-λλs+1
x=1 s!
∞ e-λλs
86
E(X)
E(x) = λ
onde
e-λλx
E(X2) =∑x.x , substituindo s = x - 1 e x =
s + 1 temos: ∞
x=1 x(x-1)!
) = ∑∞
2
6.2 Exercícios
87
1) Admitindo-se o nascimento de meninos e meninas sejam
iguais, calcular a probabilidade de um casal com 6 filhos ter:
a) 4 filhos e 2 filhas b) 3 filhos e 3 filhas
88
8) Certo posto de bombeiros recebe em média 3 chamadas por
dia. Calcular a probabilidade de:
a)receber 4 chamadas num dia;
b)receber 3 ou mais chamadas num dia;
c) 22 chamadas numa semana.
89
É uma distribuição de probabilidade usada para variáveis
aleatórias contínuas, definida num intervalo a,b , e sua função densidade
de probabilidade é dada por:
1
f(x) = b − ase a ≤ x ≤ b .
0 se x < a ou x > b
E(X) x f(x) dx
1
E(X) = ∫ ax b
dx b - a
1 x 2 b
E(X) = b - a 2 a
E(X) = b2 − a2 2(b−
a)
E(X) = (b-a) (b +a)
2(b −a)
E(X) =
6.3.1.2 Variância da Distribuição Uniforme
90
V(X) = E(X2 )− E(X) 2
E(X 2 ) f(x) dx
1
E(X 2 ) = ∫ b
x 2
dx a b - a
E(X 2 ) x 2 dx
E(X
=
2
) b1-a x33 ba
E(X2) = b3 − a3
3(b−a)
E(X2) = (b-a)(b2 +ab+a2 )
3(b −a)
2
) = b2 +ab+a2
E(X
3
V(X) = − a2
3 4
4b2 +4ab+ 4a2 −3b2 −6ab −3a2
V(X) =
12
b2 − 2ab+ a2
V(X) =
12
V(X) = (b − a)2
12
91
Uma variável aleatória X, que tome todos os valores reais -∞ < x
< +∞ tem
distribuição normal quando sua função densidade de probabilidade
(f.d.p.) for da forma:
1
−
2
1
σ 2
x −µ ,−∞< x < +∞
f(x) =e
2π σ
f(x) d(x) =1
x−µ
fazendo t = temos:
σ
f(x) d(x) I.
Para calcular esta integral usaremos um artifício, ou seja, no
lugar de I usaremos I².
t s
1 +∞ −2 +∞ −
I =
2
∫
2π −∞
e dt . ∫ −∞
e 2 ds
( t 2 +s 2 )
1 +∞ +∞ −
I =
2
2 π
∫
- ∫
-
e 2 dt ds
∞ ∞
s = r cosα e t = r senα
92
consequentemente o elemento de área ds dt se torna r dr dα.
Como , portanto
I 2= ∫ ∫re
0 0 dr dα
2π
+∞
2
I= ∫ e dα 2π 0 0
I2 = 1 α 20π
2π
I2 = 2π =1
I² = 1 , logo I = 1 como queríamos mostrar.
93
FIGURA 7.2 - Distribuição Normal em função da µ e σ
E(X) x f(x) dx
fazendo z e x = z σ +µ,
1 ∞
E(X) = ∫ (σ z + µ) e 2 dz
2π −∞
z z
1 σ +∞ −2 1 +∞ −
E(X) = ∫ z e dz
2π −∞
+µ ∫ e dz
2π −∞
2
+ −z
zero um
E(X) = µ
E(X 2 ) f(x) dx
94
−∞
σ 2π fazendo z
e x = z σ +µ,
E(X 2 ) = 1 σ∫+∞(σ z + µ) 2
e− z2 dz σ 2π −∞
= 1 σ 2 ∫ z 2 e 2 dz + 1 2µ σ∫ z e 2 dz +µ 2 1 ∫ e 2
+ + +
E(X 2 ) ∞
2π −∞
−z ∞ 2π −∞−z
∞ −
z dz π −∞
2
um
zero
2π −∞
z2 = u dv dz
du = 1 −z2
dz =−e 2
z
1 −
−∫ − e
2 2 2
E(X ) =
2
σ z e
z dz + µ
2
2
2π
z
E(X 2 )
E(X2) = σ2 +µ2
logo,
V(X) = σ²
6.3.2.4 Distribuição Normal Padronizada
95
FIGURA 7.4 - Complemento da Distribuição Normal Padronizada
= x−µ
Fazendo z e z ~ N(0,1)
temos que σ
1
f(z) = ∫+∞ e− z2 ,
2
2π −∞
96
A distribuição t também possui parâmetros denominado "grau de
liberdade - ϕ". A média da distribuição é zero e sua variância é dada por:
[ ] ( )
VAR tϕ =σ2 tϕ = ϕ
ϕ −2 , para ϕ > 2.
6.4 Exercícios
97
4) Em uma distribuição normal 28% dos elementos são
superiores a 34 e 12% inferiores a 19. Encontrar a média e a
variância da distribuição. (R = X = 29.03, S2 = 73.44)
98
10) Certa máquina de empacotar determinado produto oferece
variações de peso com desvio padrão de 20 g. Em quanto deve
ser regulado o peso médio do pacote para que apenas 10%
tenham menos que 400 g? Calcule a probabilidade de um
pacote sair com mais de 450 g. [R = a) µ = 425.6 b) 0.11123 )]
7 Amostragem
99
2o) População a ser Amostrada
Aleatoria Simples
Sistematica
- Tipo de Amostragem
Estratificada
por Conglomerados
aleatória simples
Tipo de Amostragem: sistemática
estratificada
100
É o processo mais elementar e frequentemente utilizado. Todos
os elementos da população tem igual probabilidade de serem escolhidos.
Para uma população finita o processo deve ser sem reposição. Todos os
elementos da população devem ser numerados. Para realizar o sorteio
dos elementos da população devemos usar a Tabela de Números
Aleatórios.
= N
Ex.: N = 5000 n = 50, então r
=10, (P.A. de razão
10) n
3 13 23 33 43 ......
an = a1 + (n −1).r
7.3.3 Amostragem Estratificada
101
As diversas subamostras retiradas das subpopulações devem ser
proporcionais aos respectivos números de elementos dos estratos, e
guardarem a proporcionalidade em relação a variabilidade de cada
estrato, obtendo-se uma estratificação ótima.
= N!
no de amostras = C N,n
n! (N - n)!
Ex.: Supondo N = 8 e n = 4
102
sem reposição: no de amostras = CN,n = n! (NN - n! )! = C8 4, =
4!8 !4! = 70
- (com reposição)
N = { 1, 2, 3, 4} n = 2 no de amostras = Nn = 42 =
16
{11, } {12, } {13, } {14, }
{21, } {2 2, } {2,3} {2,4}
{31, } {3 2, } {33, } {34, }
{41, } {4 2, } {4,3} {4,4}
- (sem reposição)
=
no de amostras = C4 2,
4!
N = { 1, 2, 3, 4} n = 2
= 6 2!
2!
- Tabela
103
xi P(X = xi )
1,0 1/16
1,5 2/16
2,0 3/16
2,5 4/16
3,0 3/16
3,5 2/16
4,0 1/16
Σ 16/16
- Gráfico
- Esperança Matemática
-Variância
ou VAR(x) = E x2 ( ) −[E(x)]2
onde E
i=1
7.7 TAMANHO DA AMOSTRA
7.7.1 Introdução
104
Os pesquisadores de todo o mundo, na realização de pesquisas
científicas, em qualquer setor da atividade humana, utilizam as técnicas
de amostragem no planejamento de seus trabalhos, não só pela
impraticabilidade de poderem observar, numericamente, em sua
totalidade determinada população em estudo, como devido ao aspecto
econômico dessas investigações, conduzidos com um menor custo
operacional, dentro de um menor tempo, além de possibilitar maior
precisão nos respectivos resultados, ao contrário, do que ocorre com os
trabalhos realizados pelo processo censitário (COCHRAN, 1965; CRUZ,
1978).
n = Z d. σ 2
onde: Z = abscissa da curva normal padrão, fixado um nível de
confiança (1- α)
105
Z = 1,65 → (1 - α) = 90%
Z = 1,96 → (1 - α) = 95%
Z = 2,0 → (1 - α) = 95.5%
Z = 2,57 → (1 - α) = 99%
Geralmente usa-se Z = 2
• Especificações Técnicas
• Resgatar o valor de estudos semelhantes
• Fazer conjeturas sobre possíveis valores
= 2 Z 2 . σ2 . N2 2
n d (N −1) + Z . σ
σ2 = variância populacional
N = tamanho da população
d = erro amostral
106
Z2 . p .
qn =
2
q=1− p
Z2 . p . q . N
n= 2
2 d (N−1) + Z . p .
q
N = tamanho da população
p = estimativa da proporção
q=1− p
d = erro amostral
107
existem fórmulas específicas segundo o critério de composição da
amostra.
Quando não tivermos condições de prever o possível valor para p, admita p = 0.50,
pois, dessa forma,
você terá o maior tamanho da amostra, admitindo-se constantes os demais elementos.
x ~
N
(µ(x);σ (x)),
2
onde z =
x
−µ(x)
σ(x)
=
µ(x) = µ (a média amostral é igual a média populacional) e σ(x)
σ(x)
(Desvio
n
Padrão Amostral)
σ2 (x)
x ~ Nµ(x); n
108
σ2(x) N - n N-n
x ~ Nµ(x); n N -1 , onde N-1 é o fator de correção
N -n
onde é usado para população
finita. N -1
7.9 Exercícios
109
1) Uma fabrica de baterias alega que eu artigo de primeira
categoria tem uma vida média de 50 meses, e desvio padrão de
4 meses.
a) Que porcentagem de uma amostra de 36 observações acusaria
vida média no intervalo de um mês em torno da média?
b) Qual será a resposta para uma amostra de 64 observações?
c) Qual seria o percentual das médias amostrais inferior a 49,8
meses com n =100?
8 Estimação de Parâmetros
110
É um processo de indução, na qual usamos dados extraídos de
uma amostra para produzir inferência sobre a população. Esta
inferência só será válida se a amostra for significativa.
i) Estimação Pontual
ii)Estimação Intervalar
a) Estatísticas
Seja (X1, X2, ..., Xn) uma amostra aleatória e (x1 ,x2, ..., xn) os
valores tomados pela amostra; então y = H(x1 ,x2, ..., xn) é uma
estatística.
Principais estatísticas:
- Média Amostral
- Proporção Amostral
- Variância Amostral
111
(n > 30 → Z)
Seja X ~ N µ,σ2( )
Como já vimos anteriormente, x (média amostral) tem
distribuição normal de média
σ
µ e desvio padrão n ,ou seja:
σ2
X ~ N µ ;
n
X −µ
z=
Portanto, tem distribuição N (0,1)
σ n
Então,
( )
P −z α 2 ≤z ≤+zα 2 =1 −α
P −zα 2 ≤ ≤+z α 2 =1 −α
σ n
σ σ
P −zα 2 −X ≤µ ≤ zα 2 −X =1−α
n n
+
σ σ
P X −z ≤µ ≤X +z =1 −α (Pop. Infinita)
α 2 n α 2 n
x −µ
112
N- n N- n
P X+Z α 2 σ ≤µ≤ Z α 2 σ =1−α (Pop. Finita)
n N -1 n N-1
( n ≤ 30)
∑ ( x − x)
n
i
2
S2 = i=1
onde n -1 = graus
de liberdade n−1
σ2
X ~ N µ ;
n
= X−µ
Portanto, t tem distribuição N (0,1)
113
S n
t = X −µ . σ = z = N(0,1)
S n S Sσ Sσ
X−µ
tϕα, 2 =
S n
Então,
(
P −tϕ,α 2≤ t ≤ +tϕ ,α 2 =1− α)
s ≤µ ≤ + s
P X −t ϕ, α 2 X t ϕ, α 2 =1−α
n n
(Pop.
Infinita)
114
S N −n ≤µ ≤ + S N −n
P X −t ϕ,α / 2 X t ϕ, α / 2
n N −1 n N −1
=1−α (Pop.
Finita)
xi ∑ n ∑ (x −x)
n i 2
X = = 8 7,
i=1
S2 = i=1
≅4 S≅
2n n −1
ϕ =10-1= 9 ϕ =5%
pˆ.qˆ
115
logo Z = pσ−pπ onde σpˆ ==Xn
pˆ =número
descaracteriza elementos tica da amostra
P
(ˆp− Z α2 σˆp ≤π≤ ˆp + Zα2 σˆp )= 1−α (Pop. Infinita)
N − n N − n
Pp− Zα 2 σp N − 1 ≤ π≤ p+Zα 2 σp N − 1 =1−α (Pop.
Finita)
S2
X2n−1 ~ Z σ2 ,
116
χ2inf = χ12− ;ϕ χ2sup =χ2 ;ϕ
Assim temos:
(n−1)S2 (n−1)S2
P 2 ≤σ ≤ 2 =
2
1−α
Xsup Xinf
µ1 − µ2
X1 − X2
a) Variâncias Conhecidas
m1 −m2 =(X1 − X 2 )± Za .(Erro Padrão)
2
Erro Padrão?
117
VAR(X1 − X 2 )
=
(+1) VAR X + (− 1) VAR X
2
1
2
2
σ12 + σ22
=
n1 n2
σ2 σ2
= 1+ 2
logo o erro padrão
n1 n2
σ21 σ 22 σ12 σ 22
P (X1 −X2 )−Z α 2 + ≤(µ1 −µ2 )≤(X1 −X2 )+Z α 2 + =1 −α
n n n n
1 2 1 2
1 1
Erro Padrão: σ +
n1 n2
Ex.: Seja duas classes muito grande com desvios padrões σ1 =1,21
e σ2 = 2,13. Extraída uma amostra de 25 alunos da classe 1 obteve-se uma
nota média de 7,8, e da classe 2 foi extraída uma amostra de 20 alunos
obteve-se uma nota média de 6,0. Construir um intervalo de 95% de
confiança para a verdadeira diferença das médias populacionais. R =
(LI=0,753; LS=2,847)
b) Variâncias Desconhecidas
118
S2 S2 S2 S2
P (X1 −X2 )−t α 2 1 + 2 ≤µ1 −µ2 ≤(X1 −X2 )+t α 2 1 + 2
n n n n
1 2 1 2
onde ϕ= n 1 + n 2
−2
Erro Padrão: SC
n11 + n12 onde Sc é o desvio padrão conjunto
SC n1 + n2 −2
Ex1.: De uma turma (1) foi extraída uma amostra de 6 alunos com
as seguintes alturas: 150, 152, 153, 160, 161, 163. De uma segunda
turma foi extraída uma amostra de 8 alunos com as seguintes alturas:
165, 166, 167, 172, 178, 180, 182, 190. Construir um intervalo de 95%
de confiança para a verdadeira diferença entre as médias populacionais.
p q p q p q p q
P (p1 −p2 )−Z α 2 1 1 + 2 2 ≤π1 −π 2 ≤(p1 −p2 )+Z α 2 1 1 + 2 2 =1 −α
n1 n2 n1 n2
119
modificação. Construir um intervalo de confiança para a diferença entre
as proporções destas subpopulações usando α=5%. R=(LI=0,0893,
LS=0,2905)
8.3 Exercícios
Média σ Tamanho da
Amostral Amostra
a) 16,0 2, 16
0 b)
37,5 3, 36 c)
0 d)
2,1 0, 25
4) 5 Numa tentativa de
0,6 0, 100 melhor o esquema de
1 atendimento, um
médico procurou
estimar o tempo médio que gasta com cada paciente. Uma
amostra aleatória de 49 pacientes, colhida num período de 3
semanas, acusou uma média de 30 min., com desvio padrão de 7
min. Construa um intervalo de 95% de confiança para o
verdadeiro tempo médio de consulta.
120
6) Uma amostra aleatória de 100 fregueses da parte da manhã de
um supermercado revelou que apenas 10 não incluem leite em
suas compras.
a) qual seria a estimativa percentual dos fregueses que compram
leite pela parte da manhã. (α = 5%). R LI = 84.12%, LS = 95.88%
b) construir um intervalo de 90% de confiança para a verdadeira
proporção dos fregueses que não compram leite pela manhã. R LI
= 5.08%, LS = 14.92%
121
8)De 48 pessoas escolhidas aleatoriamente de uma longa fila de
espera de um cinema, 25% acharam que o filme principal
continha demasiada violência.
a) qual deveria ser o tamanho da fila, a partir do qual se pudesse
desprezar o fator de correção finita;
b) construa um intervalo de 98% de confiança para a verdadeira
proporção, se há 100 pessoas na fila;
c) construa um intervalo de 98% de confiança para a verdadeira
proporção, se há 500 pessoas na fila.
10 11 11 11 12 12 12 12 13 13
13 13 13 13 13 13 13 13 13 13
14 14 14 14 14 15 15 15 16 16
a) 2 3 4 5 5 6 6 7 8 8 9
n = 11
b) 12 12 15 15 16 16 17 18 20 22
22 23 n = 12
c) 25 25 27 28 30 33 34 35 36
n=9
11) Sendo X uma população tal que X ~ N(µ;σ2 ) em que µ e σ² são
desconhecidos.
8,7, e
122
. Determinar um intervalo de confiança de 95% para µ e σ² ,
supondo:
n n−1
123
17) A média salarial semanal para uma amostra de n = 30
empregados em uma grande firma é X = 180,00 com desvio
padrão S = 14,00. Construa um intervalo de confiança de 99 %
para a média salarial dos funcionários.
Branco 8 18 10 10 14
Preto 9 12 5 10 14 12 6
124
a)a média da população branca, e a média da população preta;
b)a diferença entre as médias entre brancos e pretos
Capacidade
Pessoa Toráxica
Antes Após (Y)
(X)
A 2750 2850
B 2360 2380
C 2950 2930
D 2830 2860
E 2250 2320
Homens Mulheres
n1 = 25 n2 = 5
X1 = X2 = 11,0
16,0
S1 = 16
2
S22 = 10
125
Resposta a
Pergunta
A favor Contra Sem opinião
"Interromper a 46% 39% 15%
gravidez"
"A favor do aborto" 41% 49% 10%
9 Teste de Hipóteses
126
9.1.1 Hipótese Estatística
H0:Θ =θ0
H1:Θ≠θ0 Teste Bicaudal ou Bilateral
H0:Θ =θ0
H1:Θ>θ0 Teste Unilateral Direito
127
H 0:Θ =θ0
H1:Θ<θ0 Teste Unilateral Esquerdo
Realidade
Ho verdadeira Ho falsa
Aceitar Decisão correta (1 - Erro Tipo II (β)
Decisã Ho α)
128
1o) Enunciar as hipóteses H0 e H1;
2o) fixar o limite do erro α, e identificar a variável do teste;
3o) com o auxílio das tabelas estatísticas, considerando α e a
variável do teste, determinar as RR (região de rejeição) e RA
(região de aceitação) para Ho;
4o) com os elementos amostrais, calcular o valor da variável do
teste;
5o) concluir pela aceitação ou rejeição do H0 pela comparação do
valor calculado no
4o passo com RA e RR.
1. Enunciar as hipóteses:
µ ≠ µ0 (a)
µ :
H0 : µ = 0 H1 µ > µ0 (b)
µ < µ0 (c)
2. Fixar α. Admitindo:
129
n n
1.Enunciar as hipóteses:
π≠ p0 (a)
Ho : π = po H1: π> p0 (b)
π< p0 (c)
130
(a) (b) (c)
Zcal = fp− .p q0
0 0
n
onde f = Xn
1.Enunciar as hipóteses:
(a)
131
(c)
χ2cal = (n −σ120)S2
onde: S2 = variância
amostral σ2 = valor
da hipótese nula
132
10.2.4 Teste de significância para igualdade de duas
médias
1. Enunciar as hipóteses:
µ1 ≠µ2
Ho : µ1 = µ2 ou µ1 - µ2 = d H1:µ1 −µ2 ≠ d
onde d é a diferença admitida
entre as duas médias.
(X − X )−d
1 2
n1 n2
5.Conclusão:
133
n2 ≤ 30) com ϕ = n1 + n2 -2;
a) As estimativas diferentes
1. Enunciar as hipóteses:
µ µ µ µ µ ≠µ
Ho : 1 = 2 ou 1 - 2 =
H1:µ11 −µ22 ≠
d d
onde d é a diferença admitida
entre as duas médias.
(X − X )
1 2 −d
tcal = 2 S 22
S1 +
n1
n2
5.Conclusões:
b) As estimativas iguais
134
1. Enunciar as hipóteses:
µ1 ≠µ2
Ho : µ1 = µ2 ou µ1 - µ2 = d H1:µ1 −µ2 ≠ d
onde d é a diferença admitida
entre as duas médias.
5.Conclusões:
1.Enunciar as hipóteses:
Ho: π1 = π2 H1: π1 ≠ π2
135
3.Com o auxílio da tabela "Z" determinar as regiões RA e RR;
5.Conclusões:
Home Mulhe
ns res
X1 = X2 = 50
70 n1 = n2 =
200 200
1. Enunciar as hipóteses:
136
Fsup = Fα(ϕ1,ϕ2)
1
Finf = F1−α(ϕ1,ϕ2 )= (ϕ 2 ,ϕ1)
Fα
Fcal = SS2122
5. Conclusões:
9.3 Exercícios
137
7.89 13.29 17.96 15.6 8.89
15.28 16.87 19.68 18.91 12.47
10.93 9.57 5.53 11.57 10.02
8.57 17.96 10.79 19.59 11.06
138
a) Supondo que o ganho de peso médio dessas pessoas é de 45 g,
teste a hipótese para α = 5%, se esse valor é o mesmo
(bilateral)
b)Supondo que a variância dessas pessoas é de 1.8 g 2, teste a
hipótese para α = 5%, se esse valor é o mesmo (bilateral).
139
15%.
Droga A Droga B
Sexo muscular intravenos muscular Total
a
Masculin 21 10 22 53
o
Feminino 20 12 25 57
Total 41 22 47 110
140
variância de impurezas entre as porções. b) Testar a hipótese
de que a média de impureza é de
10.4, usando α = 5%. c) Testar a hipótese de que a variância é um
usando α =
5%.
12) Sendo
141
14) Da população feminina extraiu-se uma amostra resultando:
142
- Teste de adequação do ajustamento
- Teste de Aderência
- Teste de Independência (Tabela de Contingência)
5o) Comparar o χ 2
cal com χ 2
tab e concluir:
6o) Conclusão:
Se χ 2
cal ≤ χ 2
tab → aceita-se Ho
143
eventos possíveis da amostra.
e dos graus de
liberdade (ϕ), os quais podem ser obtidos da seguinte forma:
Resolução:
144
Ho: As frequências são iguais em todos os dias
H1:As frequências são diferentes em todos os dias
Fe = n . pi 25 25 25 25 25 25 25 ---
Conclusão: Como o χ2cal < χ2tab, aceita-se Ho, ou seja, para α = 5%,
as frequências podem ser iguais.
145
No de Defeitos 0 1 2 3 4 5 6 7
N de Aparelhos
o
25 35 18 13 4 2 2 1
Resolução:
No de Defeitos 0 1 2 3 4 5 6 7 n
N de Aparelhos
o
25 35 18 13 4 2 2 1 100
pi 0.212 0.32 0.25 0.132 0.051 0.016 0.00 0.001 1.000
9 5 4
Fe = n . pi 21.2 32.9 25.5 13.2 5.1 1.6* 0.4* 0.1* 100
e−µµi
Para calcular pi, temos: pi = (Distribuição
de Poisson) i!
n
∑X .f i i
µ= X = i=1
= 155.
n
e−1.55(1.55)0
p 0= = 0.212 p
0!
e−1.55 (1.55)1
p1 = = 0.329 p
1!
e−1.55(1.55)2
p 2= = 0.255 p
2!
e−1.55 (1.55)3
p 3= = 0.132 p
146
3!
Conclusão: Como o 2
tab , aceita-se Ho, ou seja, para α = 5%,
a distribuição do número de defeitos/unidade pode
seguir uma Distribuição de Poisson.
Ex2.: Verificar se os dados das distribuição das alturas de 100
estudantes do sexo feminino se aproxima de uma
distribuição normal, com α = 5%.
Resolução:
Altura (cm) o
N de Transf. "Z" Prob (área) Fe = n . pi
Estudantes
150 |--- 156 4 -∞ |--- - 0.026 * 2.6
156 |--- 162 12 1.94 0.123 12.3
162 |--- 168 22 -1.94 |--- - 0.295 29.5
168 |--- 174 40 1.04 0.332 33.2
174 |--- 180 20 -1.04 |--- - 0.175 17.5
180 |--- 186 2 0.14 0.048 * 4.8
H
-0.14 |---
o 0.76 :
0.75 |--- A
1.66
1.66 |---
+∞
k=6 100 1.000 100.0
distribuição da altura das estudantes do sexo feminino é normal
147
H1: A distribuição da altura das estudantes do sexo feminino não
é normal
= x −µ
Para calcular pi, temos: Zi (Distribuição Normal Padrão)
S Z2 == −1 04.
∑ f .(X − X)
n
n
i i
∑X .fi i S= i=1
= 6.67 n
µ= X = i=1
=168.96 n −1
Z1 ==−1 94. Z
Z3 == −0.14
Conclusão: Como o 2
tab , aceita-se Ho, ou seja, para α =
5%, a distribuição da altura das estudantes do sexo
feminino é normal.
148
9.4.4 Tabelas de contingência – Teste de independência
)
k
(F − F )
o e
2
eij = (soma da linha i)(soma da coluna j
F
i=1 Fe total de observações
A B C D
X 28 42 30 24
Y 44 78 78 76
149
Ho: As variáveis são independentes
H1: As variáveis são dependentes
A B C D Total
()
X 28 42 30 24 124
Y 44 78 78 76 276
Total 72 120 108 100 400
(c)
(
χ2calc = 28− 22,.32)2 + (42 −37,2)2 +...+ (76 −69)2 = 5,81
22,32 37,2 69
Conclusão: Como o 2
tab , aceita-se Ho, ou seja, para α = 1%,
as variáveis são independentes.
150
C = χ2χ2cal+ n
cal
9.5 Exercícios
No de Acidentes 0 1 2 3 4 5
No de Dias 25 19 10 9 4 3
Sexo Partido
A B
C = 4% Masculino 50 72
Feminino 29 35
151
5)A tabela indica o número médio de acidentes por mil
homens/hora da amostra de
50 firmas obtidas de uma indústria específica. A média desta
distribuição é de 2.32 e o desvio padrão de 0.42. Teste a
hipótese nula de que as frequências observadas seguem uma
distribuição normal, com α = 5%.
o o
N de Acidentes N de Firmas
1.5 --- 1.7 3
1.8 --- 2.0 12
2.1 --- 2.3 14
2.4 --- 2.6 9
2.7 --- 2.9 7
3.0 --- 3.2 5
Total 50
R = Aceita Ho
152
10 REGRESSÃO E CORRELAÇÃO
10.1 Introdução
10.2 Definição
153
10.3 Modelo de Regressão
yˆ i =α xi + β+εi
Obs. 1 2 3 4 5 6 7 8
Vendas 201 22 30 38 56 60 68 73
5 5 0 0 0 5 5
Lucro 17 20 21 23 25 24 27 27
154
Pelo gráfico podemos observar que a possível reta de regressão
terá um coeficiente de regressão (coeficiente linear) positivo.
10.4 Método para estimação dos parâmetros a e b
10.4.1 Características
n n n
n∑xy −∑x∑y
S b = y−a
x
155
a= i=1 ∑ n 2 − i = ∑ 1n xi= 1 2 =
Sxyxx n x
i=1 i=1
ei = yi − yˆi = yi −(a+bxi )
Venda Lucro
Obs. s Xi Yi X 2i X i .Yi
Yi2
1 201 17 40401 289 3417
2 225 20 50625 400 4500
3 305 21 93025 441 6405
4 380 23 14440 529 8740
0
5 560 25 31360 625 1400
0 0
6 600 24 36000 576 1440
0 0
7 685 27 46922 729 1849
5 5
8 735 27 54022 729 1984
5 5
Σ 3691 184 20115 4318 8980
01 2
n n n
8 ((898022011501)−()3691−(3691)(184)2) =
0,0159 n n 8
nxi
i=1 i=1
156
b = y−a x = 23-(0,159)(461,38)=15,66
yˆ = 0,0159 x + 15,66
Saída do Statistica
Saídas do Statistica
157
A dispersão da variação aleatória “y” pode ser medida através da
soma dos quadrados dos desvios em relação a sua média y. Essa soma
de quadrados será denominada Soma de Quadrados Total (SQTotal).
n n n
∑(y − y) =∑(yˆ
i
2
i − y)2 +∑(yi − yˆ i )2
i=1 i=1 i=1
i=1 i=1
Assim:
SQ Regress ao
A estatística definida por r 2 = ~ , e
denominada coeficiente de
SQTotal
determinação, indica a proporção ou percentagem da variação de Y que
é “explicada” pela regressão.
Note que 0 ≤ r2 ≤ 1.
n n n 2
SQTotal = yi ,
i=1 i=1 i=1
158
com (n - 1) graus de liberdade.
~ ~
SQRegress ao/1 = QMRegress ao ,
SQResiduo/n -2 QMResiduo
Análise de Variância
1 QMResiduo
Resíduo n-2 SQResíduo QMResíduo ---
n -2
Total n-1 SQTotal --- ---
159
H0: β=0 contra H1: β≠0, onde β representa o coeficiente de
regressão paramétrico.
Vendas Lucro
Obs. Xi Yi X 2i Yi2 X i .Yi
1 201 17 40401 289 3417
2 225 20 50625 400 4500
3 305 21 93025 441 6405
4 380 23 144400 529 8740
5 560 25 313600 625 14000
6 600 24 360000 576 14400
7 685 27 469225 729 18495
8 735 27 540225 729 19845
Σ 3691 184 2011501 4318 89802
yˆ i = 0,0159xi +15,66
i=1 i
~
SQRegress ao = 0,0159[8(89802)−(3691)(184)] = 624,42
n n 2
SQTotal = n yi
i=1 i=1
160
Resíduo 6 63,58 10,59587 ---
Total 7 688,00 --- ---
H 0: β = 0 e H 1: β ≠ 0
n n n 2
VT = SQTotal = yi ,
i=1 i=1 i=1
VÑE = ∑(y − yˆ )
i i
2
i=
161
n n
n
2
∑ n∑∑xy−2∑ ∑x ∑ y ∑ n 2 n 2 =
SCOVxx.Sxyyy 2 = i=1 i=1 i=1
r
n n x2 − n x n y − y
i=1 i=1 i=1 i=1
r2 = = 0.908
Saídas do Statistica
162
- A magnitude de r indica quão próximos da "reta" estão os
pontos individuais;
n n n
n∑ xy −∑ x ∑ y
i=1 i =1 i =1
S xy
r= =
n 2 n n 2 n S xx .S yy
n∑ x − ∑ x n ∑ y − ∑ y
i=1 i=1 i=1 i=1
163
Logo podemos observar que o coeficiente de determinação nos
dá uma base intuitiva para a análise de correlação.
Saída do Statistica
10.9 Exercícios
X = 1o Exame e Y = 2 o Exame
Aluno 1 2 3 4 5 6 7 8 9 1
0
Exame 1 82 84 86 83 88 87 85 83 86 8
5
Exame 2 92 91 90 92 87 86 89 90 92 9
164
0
R = y=−0.79 x +157. 25; r² = 53.29%; r = -0.73
Aluno 1 2 3 4 5 6 7 8
Horas 2 4 5 5 6 8 9 10
Nota 1 3 6 6 8 7 8 10
R = y= 0.98 x +0.12; r² = 82.99%; r = +0.911
Indivíduo 1 2 3 4 5 6 7 8
Seguro 20 16 34 23 27 32 18 22
Renda 64 61 84 70 88 92 72 77
R = y=1.50 x +40.08; r² = 74.3%; r = +0.86
Indivídu 1 2 3 4 5 6 7 8 9 10
o
Peso Pai 6 63 67 64 68 62 70 6 68 67
5 6
Peso 6 66 68 65 69 66 68 6 71 67
Filho 8 5
R = y= 0.48 x +35.48; r² = 40.58%; r = +0.637
11 Referências Bibliográficas
165
COSTA NETO, P.L.O.; CYMBALISTA, M. (1994). Probabilidades. São
Paulo: Edgard Blucher.
166