JJJJJ
JJJJJ
JJJJJ
Apresentação
• Amostra
• Variáveis
População ou universo estatístico
• é o conjunto da totalidade de indivíduos que
apresentam características em comum, cujo
comportamento se quer inferir(analisar)
• Pode ter número finito ou infinito de elementos
• Exemplo de população:pessoas, animais,
minerais, vegetais...
Amostra
• Subconjunto da população, porem permite
a obtenção de dados representativos da
população
- tempo
-praticidade
- economia
-motivos geográficos
Variáveis
• Conjuntos de resultados (ou
características) possíveis de um fenômeno
-Podem ser classificados em:
Qualitativas Quantitativas
Qualitativas (ou categóricas)
• Nominais: não existe
ordenação nas categorias
Variáveis
Qualitativa Quantitativa
Vantagens:
– Economia
– tempo
– confiabilidade de dados
– operacionalidade ( ex: dados em menor escala)
Amostragem casual ou aleatória
simples
• Todos os elementos da população estão
disponíveis
• Qualquer elemento da população tenha
mesma probabilidade de ser selecionado
• A seleção ocorre por meio de sorteio
Amostragem proporcional
estratificada
• A população e dividida em estratos
proporcionais
• Cada estrato é um subconjunto da
população
Estratificada uniforme
• Não utiliza critérios de proporcionalidade
• É utilizado quando quer-se obter
estimativas separadas para cada extrato
Sistemática
• Tipo de amostragem aleatória, porem, é
utilizada quando os elementos da
população encontram-se ordenados
Método para a seleção dos elementos
de uma amostra sistemática de uma
população
• Intervalos de seleção(I)
I=N/n, onde N=população e n= amostra
• Primeiro elemento(m)
Aleatório no intervalo [0;I]
• Próximos elementos
m+I, m+2I, m+3I,......
• Último elemento
....,m+(n-1)I
Exemplo
• N=21
• n=3
• .
I=
N =21/3=7
n
• sorteio entre 1 e 7=2
• Primeiro: m=2 Bret
• Segundo: m+I=2+7=9 Irene
• Terceiro: m+2I=2+14
Philippe
Aula 03
• Tabelas
• Séries estatísticas
Tabelas
É um conjunto de observações a respeito de
determinado assunto, organizadas e
distribuídos num quadro.
Título
Cabeçalho(variável A) Cabeçalho(variável B)
Fonte
Series estatísticas
• Tabela estatística que apresenta um
conjunto de dados em função do(a):
- época – temporal
- Local – geográfica
- Espécie - Específica
- Distribuição de freqüência *
Séries temporais, cronológicas,
históricas, evolutivas (ou marchas)
Expectativa de vida das mulheres
Brasileiras
Ibm 2004
Samsung 934
• Local: Brasil (constante)
Positivo 815
LG 751 • Tempo:2007
Microsoft 496 (constante)
Del 533
• Linhas ou curvas
• Colunas ou barras
• Setores
Linhas ou Curva
colunas
Colunas múltiplas
Barras
Setores
Gráfico polar ou radar
• Conjunto de pontos agrupados por categoria em um círculo de 360 graus. Os valores
são representados pelo comprimento do ponto, conforme medido do centro do
círculo. Quanto mais distante o ponto está do centro, maior é o seu valor. São
exibidos rótulos de categoria no perímetro do gráfico
Cartograma
Pictograma
DISTRIBUIÇÃO DE
FREQUÊNCIA
(dados não agrupados em intervalos de classe)
4 Separado 17 17/56=0,3036
Total=56 56/56=1,0
Frequência relativa percentual ( fri %)
2 1 1 0 2
0 0 0 1 0
1 0 0 2 1
1 0 0 1 1
0 2 1 0 0
1 2 0 1 0
2 1 1 0 2
0 0 0 1 0
1 0 0 2 1
1 0 0 1 1
0 2 1 0 0
1 2 0 1 0
k=1+3,322 log n
ou
k= n
ou
• k= 40 =6,3=7
Amplitude amostral (AA)
AA 55,88 − 16,18
h= =
k 7
h = 5,6714 → 5,68
convenientemente
Limite superior e inferior do
intervalo de classe
• Extremidade dos valores que compõem um intervalo de
classe
• Simbologias adotadas:
Tipo de intervalo Símbolos da
representação
Tipo 1 Tipo 2 Tipo 3
Fechado a esquerda e fechado a direita ├──┤ [a,b] [a,b]
Aberto a esquerda e aberto a direita ─── ]a,b[ (a,b)
Fechado a esquerda e aberto a direita ├── [a,b[ [a,b)
Aberto a esquerda e fechado a direita ──┤ ]a,b] (a,b]
• AT=(Li - li)
+
l i Li
xi =
2
Exemplo
• Com o objetivo de elaborar um relatório, o
gerente de produção realizou o levantamento
dos salários de todos os operários da linha de
produção da empresa. Os dados estão
registrados na tabela próxima .
Dados salariais dos operários da
empresa (valores em reais)
1800 960 1220 950 1410 1600 1450 1510 1060 980
1330 1190 1130 1800 1390 1740 1660 1400 1760 1840
1270 990 1380 1550 1020 1730 1210 1100 1000 1580
980 1650 1500 950 1800 1620 1280 1300 1220 1440
1510 1660 1200 1330 1700 980 1050 1340 1850 1000
• a) Identifique a variável em estudo e classifique-a.
• b)Elabore uma tabela com os dados organizados
(rol).
• c) Qual o numero de dados coletados na
pesquisa?
• d) Calcule o número de classes(k).
• e) Calcule a amplitude amostral (AA).
• f) Calcule a amplitude do intervalo de classes(h).
• G) Elabore a tabela de distribuição de frequência.
• H) Determine a amplitude total (AT)
• i) Elabore uma tabela discriminando o ponto
médio de cada intervalo de classe(xi), os valores
da fi, fri, fri%, faci, fraci, fraci%,
Resolução
• a) Identifique a variável em estudo e classifique-a.
Variável quantitativa contínua
950 980 1050 1200 1280 1380 1450 1580 1660 1800
950 990 1060 1210 1300 1390 1500 1600 1700 1800
960 1000 1100 1220 1330 1400 1510 1620 1730 1800
980 1000 1130 1220 1330 1410 1510 1650 1740 1840
980 1020 1190 1270 1340 1440 1550 1660 1760 1850
Resolução
• c) Qual o numero de dados coletados na pesquisa?
50 dados coletados
k = n = 50 = 7classes
ou
1 950├── 1080
2 1080 ├── 1210
3 1210 ├── 1340
4 1340 ├── 1470
5 1470 ├── 1600
6 1600 ├── 1730
7 1730 ├── 1860
Rol
950 980 1050 1200 1280 1380 1450 1580 1660 1800
950 990 1060 1210 1300 1390 1500 1600 1700 1800
960 1000 1100 1220 1330 1400 1510 1620 1730 1800
980 1000 1130 1220 1330 1410 1510 1650 1740 1840
980 1020 1190 1270 1340 1440 1550 1660 1760 1850
distribuição de frequência
Classe Intervalos de classe Número de
si (reais) operários
1 950├── 1080 12
2 1080 ├── 1210 4
3 1210 ├── 1340 8
4 1340 ├── 1470 7
5 1470 ├── 1600 5
6 1600 ├── 1730 6
7 1730 ├── 1860 8
Resolução
• h) Determine a amplitude total (AT) Cla Intervalos de Número
sse classe (reais) de
si operários
950 980 1050 1200 1280 1380 1450 1580 1660 1800 1 950├── 1080 12
950 990 1060 1210 1300 1390 1500 1600 1700 1800 2 1080 ├── 1210 4
3 1210 ├── 1340 8
960 1000 1100 1220 1330 1400 1510 1620 1730 1800
4 1340 ├── 1470 7
980 1000 1130 1220 1330 1410 1510 1650 1740 1840
5 1470 ├── 1600 5
980 1020 1190 1270 1340 1440 1550 1660 1760 1850
6 1600 ├── 1730 6
7 1730 ├── 1860 8
2 4 ├─ 6 5
3 6 ├─ 8 8
Propriedades
• A área do histograma é proporcional a
soma das frequências
• Com a frequência relativa se obtém um
gráfico de área “unitária”
• Possibilita a comparação entre duas ou
mais distribuição de frequência
Construção do histograma
i xi fi fri
1 2├─ 4 10 0,44
2 4 ├─ 6 5 0,22
3 6 ├─ 8 8 0,34
total 23 1
20+10+16 = 46 0,88+0,68+0,44=2
Polígono de frequência ( configuração linear)
i xi X(médio) i fi
1 2├─ 4 3 10
2 4 ├─ 6 5 5
3 6 ├─ 8 7 8
total 23
Polígono de frequência acumulada
(Ogiva de Galton)
(intervalo de classe)
i xi X(médio) fi faci
i
1 2├─ 4 3 10 10
2 4 ├─ 6 5 5 15
3 6 ├─ 8 7 8 23
4 8├─ 10 9 1 24
5 10 ├─ 12 11 1 25
6 12 ├─ 14 13 5 30
total 30
Polígono de frequência acumulada
(Ogiva de Galton)
(sem intervalo de classe)
i Xi fi faci
1 2 10 10
2 4 5 15
3 6 8 23
4 8 1 24
5 10 1 25
6 12 5 30
6 14 2 32
total 32
Formas das curvas de frequência
• Em forma de sino: simétrica e assimétrica
• Em forma de Jota: Jota e Jota invertido
• Em forma de U
• Distribuição retangular
Medidas de posição
• Medidas de posição de tendência central:
-média
-mediana
-moda
__
x + +...+ x
∑x i
1 x2 i =1
x= n
=
n n
-Exemplo: Calcule a média dos salários abaixo (R$):
1000, 1200, 1300, 900, 1000, 1400
n
n
=
__
86
n x= 0 + 0 + 0 + 0 +1+1+1+1+1+1+......+ 3+ 4 + 4
= = 1,7
50 50
Média: Aplicação na estatística
(dados agrupados sem intervalos de classe)
Nº de Nº de
• Foi realizada uma pesquisa computadores residências
xi.fi
em 50 residências para saber (xi)
(fi)
o numero de computadores 0 4 0
em cada casa. A tabela 1 19 19
representa esta pesquisa. 2 16 32
Calcular a média aritmética 3 9 27
ponderada dessa distribuição. 4 2 8
total 50 86
resolução
__
x .f
1
+ x2 . f + x3 . f + x4 .
f + x5 . f
x= 1 2 3 4 5
__
x=
∑ x .f i i
f 1
+ f 2
+ f 3
+ f +f 4 5
__
0.4 + 1.19 + 2.16 + 3.9 + 4.2 86
∑f i
x=
4 + 19 + 16 + 9 + 2
=
50
= 1,7
Média: Aplicação na estatística
(dados agrupados com intervalos de classe)
altura Nº de Ponto médio
• Uma nova técnica de das alturas xi.fi
(xi) pés
adubação foi testado em 109 (fi)
pés de milho. Foram medidas 150├ 157 7 153,5 1074,5
as alturas das plantas(em cm) 157 ├ 164 19 160,5 3049,5
com dois meses e os 164├171 25 167,5 4187,5
resultados apresentados na 171├178 26 174,5 4537
tabela.Calcule a média das 178├185 21 181,5 3811,5
alturas dos pés de milho. 185├192 8 188,5 1508
192├199 3 195,5 583,5
resolução total 109 18754,5
__
x=
∑x .f
i i __
x .f
1
+ x2 . f + x3 . f + ... + x7 . f
x= 1 2 3 7
∑f i f 1
+ f 2
+ f 3
+ ... + f 7
__
7.153,5 + 19.160,5 + ... + 3.195,5 18754,5
x= = = 172,06
7 + 19 + ... + 3 109
Moda
É o valor que ocorre com maior número de
ocorrência ( serie não agrupada)
resolução
• Fórmula de Czuber: = + d 1 .
M 0 l M 0 + hM 0
d1 d 2
l + Lm 0
• Moda bruta: = m0
M 0
2
Moda: Aplicação na estatística
(dados agrupados com intervalos de classe)
• Uma nova técnica de adubação altura Nº de
foi testado em 109 pés de milho. (xi) pés
Foram medidas as alturas das (fi)
plantas(em cm) com dois meses e 150├ 157 7
os resultados apresentados na
tabela.Calcule a moda das alturas 157 ├ 164 19
dos pés de milho. 164├171 25
171├178 26
178├185 21
total 109
= + d 1 .
M 0 l M 0 + hM 0
d1 d 2
altura Nº de
pés
Fórmula de Czuber: (xi)
(fi)
150├ 157 7
d
M = l M + + . hM
0
1 157 ├ 164 19
d d 164├171 25
0 0
1 2
Sendo 171├178 26
178├185 21
• lm0 = limite inferior da classe modal
185├192 8
• d1 = diferença entre a frequência da classe
192├199 3
modal e a frequência anterior a classe modal
total 109
• d2 = diferença entre a frequência da classe modal
e a frequência postreior a classe modal
• hm0 = amplitude da classe modal
26 − 25
M0 = 171 +
(26 − 25) + (26 − 21) .7 =
1 7
171 + .7 = 171 + = 171 + 1,16 = 172,16
1+ 5 6
Moda bruta
altura Nº de
• É a média entre os limites (xi) pés
(fi)
inferior e superior 150├ 157 7
157 ├ 164 19
164├171 25
= l m 0 + Lm 0 171├178 26
M 0
2
178├185
185├192
21
8
192├199 3
total 109
Exemplo 2:
Dados os números: 1,2,3,4,5,6,7,8 a mediana está entre os números 4
e 5 pois existem três números antes do 4 e três números após o 4
Exemplo 1: (número impar de elementos)
Dados os números:1,2,3,4,5 a mediana é o 3 pois
divide o conjunto em duas partes iguais
Fórmula da posição:
n +1
Pmd = 2
n n
Pmd = entre 2 e 2 + 1
Mediana: Aplicação na estatística
(dados não agrupados)
• Amplitude total
• Variância e desvio total
• Coeficiente de variação
Amplitude total
• Para serie simples: AT = X máx − X mín
Ex: (1,3,4,4,5,7,9) → AT= 9-1=8
• Em gráficos: δ T
= X máx
− X mín
δ T
= 5000 − 2700 = 2300
= 11 − 2 = 9
2├5 14
5├8 10 A T
8├11 21
Variância e desvio padrão
• O desvio padrão é a raiz da variância e
consequentemente a a variância é o
quadrado do desvio padrão.
∑ ∑ ∑ ( x − x) ∑d
2 2 2
( x − x) 2
var = i
= d i des = i
= i
n n n n
∑ ∑d ∑ ( x − x) ∑d
2 2
( x − x) 2 2
var = i
= i des = i
= i
n −1 n −1 n −1 n −1
Variância e desvio padrão
(para dados agrupados)
var =
∑ (x − M
i e
) 2
. f ∑ xi M e .
( − ) 2
f
des =
i i
∑f i ∑f i
∑ (x − M ) . f 2
∑ xi M e .
( − ) 2
f
des =
(∑ f )− 1
i e i
var =
(∑ f )− 1
i
i i
Dispersão absoluta e relativa
disp.abs.
disp.rel. =
média
Coeficiente de variação de
Pearson
des
cv =
média
Aplicação: Determine o desvio padrão e o
coeficiente de variação da quantidade de
quartos alugados no hotel
Mês Quartos (x) X-méd (X-méd)2
∑ xi
fev 690 452,22 – 56538
690= 237,7 ( − x ) 2
334955,6
mar 380 452,22 – 5216 var = = = 37217,2
380= 72,2 n 9
abr 280 452,22 – 29660
280= 172,2
mai 320 452,22 –
320=132,2
17482 Des = Var →
jun 300 452,22 – 23161
300= 152,2 → des = 37217,2 = 192,9
jul 710 452,22 – 66449
710= 257,7
ago 270 452,22 – 33204
270= 182,2
des 192,9
set 360 452,22 –
360=92,2
8504
cv = = = 0,42 = 42%
total 4070 334955,6
média 452,2
Comparação entre dois Hotéis
Mês Quartos ocupados
Hotel A Hotel B
jan 760 420
fev 690 450
mar 380 510
abr 280 460
mai 320 470
jun 300 440
jul 710 480
ago 270 430
set 360 410
média 452,22 452,22
Desvio padrão 192,2 31,53
Coef. de variação 42,6 % 6,97 %
Exercícios
1.Dada a série: 10;5;8;9;3;9, calcule: A média, a
mediana,a moda, a variância, o desvio padrão e
o coef. de variação.
1 40,00├ 80,00 5
2 80,00├ 120,00 16
3 120,00├ 1600,00 21
4 160,00├ 200,00 27
5 200,00├ 240,00 18
6 240,00├ 280,00 10
7 280,00├ 320,00 6
total