Aulas Estat Med Disper

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 10

Estatstica - exEstatMedDisper.

doc

25/02/09

Medidas de Disperso
Introduo

So medidas estatsticas utilizadas para avaliar o grau de variabilidade, ou


disperso, dos valores em torno da mdia. Servem para medir a
representatividade da mdia.

disperso

Sejam as sries : a) 20, 20, 20

Nos dois casos acima temos as seguintes mdias:

b) 15, 10, 20, 25, 30

= 20

= 20

Observe que, apesar das sries terem mdias iguais, a srie a no


apresenta disperso em torno da mdia igual a 20, enquanto os valores da
srie b apresentam disperso em torno da mesma mdia.

Amplitude total

uma medida de disperso dada pela diferena entre o maior e o menor


valor da srie.

R=x
xmn
mx

Exemplo 1: Calcule a amplitude total da srie: 10, 12, 20, 22, 25, 33, 38.
Soluo:
R = 38 10 = 28

E Nemer

1 / 10

Estatstica - exEstatMedDisper.doc

25/02/09

A utilizao da amplitude total como medida de disperso limitada,


pois, sendo uma medida que depende apenas dos valores externos,
no capta possveis variaes entre esses limites.

Varincia amostral

Como se deseja medir a disperso dos dados em relao mdia,


interessante analisar os desvios de cada valor (xi) em relao mdia, isto
:

di = xi x

Se os di forem baixos, teremos pouca disperso, ao contrrio, se os desvios


forem altos, teremos elevada disperso.

Pode-se verificar que a soma dos desvios em torno da mdia zero, ou


seja:

di = 0
Logo, no clculo da varincia consideram-se os quadrados dos desvios: di2.

A varincia, S2, de uma amostra de n medidas igual soma dos


quadrados dos desvios: di2, dividida por (n-1), assim:

di

n 1

(xi x)

n 1

Para dados agrupados, tem-se que:

di

n 1

(xi x)

n 1

Desenvolvendo-se o quadrado das diferenas:

(xi x)

E somando-se os termos comuns, encontram-se as seguintes frmulas


prticas para o clculo da varincia amostral:

E Nemer

2 / 10

Estatstica - exEstatMedDisper.doc

1
=

n 1

( xi )

25/02/09

ou

1
=

n 1

xF
i

( xi F )

Quanto maior o valor de S2, maior a disperso dos dados amostrais.

Exemplo 2: Calcular a varincia para as medidas amostrais: 3, 7, 2, 1, 8.


Soluo:
Vamos determinar S2 pela frmula bsica. Para tanto, interessante a
construo da seguinte tabela:

xi
3
7
2
1
8
= 21

di = (xi x)
di2 = (xi x)2
(3 4,2)=-1,2
1,44
2,8
7,84
-2,2
4,84
-3,2
10,24
3,8
14,44
0
38,80

Observe que a soma dos desvios


em torno da mdia zero.

A mdia amostral ser:

x=

xi
n

21
= 4,2
5

Logo, a varincia amostral ser:

1
=

n 1

( xi )

2
1

= 127 (21) = 9,7


5
4

Desvio padro amostral

Como visto anteriormente, o clculo da varincia obtido pela soma dos


quadrados dos desvios em relao mdia. Assim que, se a varivel sob
anlise for medida em metros, a varincia dever ser expressa em m2
(metros ao quadrado). Ou seja, a varincia expressa pelo quadrado da

E Nemer

3 / 10

Estatstica - exEstatMedDisper.doc

25/02/09

unidade de medida da varivel que est sendo estudada. Para melhor


interpretar a disperso de uma varivel, calcula-se a raiz quadrada da
varincia, obtendo-se o desvio padro que ser expresso na unidade da
medida original. Assim:
S = S2

O desvio padro das cinco medidas do Exemplo 2 dado por:

S = S 2 = 9,7 = 3,1

Interpretao do desvio padro amostral

Vamos estudar aqui duas regras para interpretao do desvio padro:

1. Regra emprica

Para qualquer distribuio amostral com mdia e desvio padro, tem-se


que:
i.

Intervalo: x S
O intervalo acima deve conter entre 60% e 80% de todas as
observaes amostrais para uma distribuio simtrica. Caso a
distribuio seja aproximadamente simtrica, esta porcentagem
aproxima-se de 70%. Caso a distribuio seja fortemente assimtrica,
essa porcentagem aproxima-se de 100%.

ii.

Intervalo: x 2S
O intervalo acima deve conter aproximadamente 95% das
observaes
amostrais
para
distribuies
simtricas
e
aproximadamente 100% para distribuies com assimetria elevada.

iii.

Intervalo: x 3S
O intervalo acima contm aproximadamente 100% das observaes
amostrais.

E Nemer

4 / 10

Estatstica - exEstatMedDisper.doc

25/02/09

2. Teorema de Tchebycheff

Para qualquer distribuio amostral com mdia e desvio padro, tem-se


que:
i.

Intervalo: x 2S
O intervalo acima contm, no mnimo, 75% de todas as observaes
amostrais.

ii.

Intervalo: x 3S
O intervalo acima contm, no mnimo, 89% de todas as observaes
amostrais.

Exemplo 3: Calcular a varincia e o desvio padro da seguinte distribuio


amostral:
xi
Fi

11

Soluo:
Vamos construir a tabela abaixo para facilitar o nosso trabalho.

xi
5
7
8
9
11

1
=

n 1

Fi
2
3
5
4
2
16

( xi F )

xF

xiFi
10
21
40
36
22
129

= 1 1083 (129) = 2,86


16 1
16

Logo, a varincia amostral 2,86.


E o desvio padro amostral dado por:

S = S 2 = 2,86 = 1,69

E Nemer

xi2Fi
50
147
320
324
242
1083

5 / 10

Estatstica - exEstatMedDisper.doc

25/02/09

Exemplo 4: Com os dados do nosso exemplo com idades de 50


funcionrios, vamos determinar a varincia, o desvio padro e interpretar o
desvio padro obtido, de acordo com as regras vistas.

18
29
36
41
49

20
29
36
43
50

20
30
37
44
51

21
30
37
44
53

22
31
37
45
54

24
31
37
45
54

25
32
38
45
56

25
33
38
46
58

26
34
38
47
62

27
35
40
48
65

Soluo: Com base nos dados, obtivemos a seguinte tabela de


distribuio de freqncias:

Classes Intervalos das classes


1
18 |----- 25
2
25 |----- 32
3
32 |----- 39
4
39 |----- 46
5
46 |----- 53
6
53 |----- 60
7
60 |----- 67
Somas

Fi
6
10
13
8
6
5
2
50

Xi
21,5
28,5
35,5
42,5
49,5
56,5
63,5

Xi Fi
129
285
461,50
340
297
292,50
127
1922

Xi2 Fi
2773,50
8122,50
16383,50
14450,00
14701,50
15961,25
8064,50
80456,50

A mdia amostral ser igual a:


n

x=

xi F
i =1

1922
= 38,44
50

A varincia amostral ser:

1
=

n 1

xF
i

( xi F )

= 1 80456,50 (1922 ) = 134,18


49
50

E o desvio padro ser: S = S 2 = 134,18 = 11,58 anos


Para verificarmos as regras para interpretao do desvio padro,
precisamos executar os seguintes clculos:

x S = 38,44 11,58 = (26,86 ; 50,02)


E Nemer

6 / 10

Estatstica - exEstatMedDisper.doc

25/02/09

Com auxlio da tabela de idades, conclumos que entre 27 e 50 anos


temos 33 elementos, logo: (33/50) 100 = 66% das observaes. Isto :
o intervalo compreendido entre a mdia menos um desvio padro e a
mdia mais um desvio padro contm, nesse exemplo, 66% das 50
idades.
A regra emprica indica que o referido intervalo dever conter de 60%
a 80% das observaes.

x 2S = 38,44 2(11,58) = (15,28 ; 61,60)


Com auxlio da tabela de idades, conclumos que entre 16 e 62 anos
temos 49 elementos, logo: (49/50) 100 = 98% das observaes. Isto :
o intervalo compreendido entre a mdia menos duas vezes o desvio
padro e a mdia mais duas vezes o desvio padro contm, nesse
exemplo, 98% das 50 idades.
A regra emprica indica que o referido intervalo dever conter
aproximadamente 100% das observaes para distribuies com
assimetria elevada.
Portanto, a distribuio com
acentuadamente assimtrica.

que

estamos

trabalhando

Observe que o resultado de 98% tambm confirma o critrio de


Tchebycheff que define no mnimo 75% de observaes para o
intervalo de x 2S .

Coeficiente de variao de Pearson

Trata-se de uma medida relativa de disperso. Enquanto a amplitude total


(R), varincia (S2) e o desvio padro (S) so medidas absolutas de
disperso, o coeficiente de variao (C.V.) mede a disperso relativa.
Assim:

C.V . =

S
100
x

Onde: S = desvio padro amostral

x
E Nemer

= mdia amostral

7 / 10

Estatstica - exEstatMedDisper.doc

25/02/09

Abaixo, temos algumas regras empricas para interpretaes do coeficiente


de variao:
Se: C.V. < 15%

tem-se baixa disperso

Se: 15% < C.V. < 30%

tem-se mdia disperso

Se: C.V. < 15%

tem-se elevada disperso

Exemplo 5: Em uma empresa, o salrio mdio dos homens de $ 4.000,


com desvio padro de $ 1.500 , e o salrio mdio das mulheres de $
3.000, com desvio padro de $ 1.200. A disperso relativa dos salrios
maior para os homens?
Soluo: Dos dados dos problemas, temos:
Homens:

= 4.000

SH = 1.500

Mulheres:

= 3.000

SM = 1.200

Para os homens:

C.V . =

S
1500
100 =
100 = 37,5%
4000
x

Para as mulheres:

C.V . =

S
1200
100 =
100 = 40%
3000
x

Portanto, os salrios das mulheres tm disperso relativa maior do que os


salrios dos homens. As duas distribuies apresentam elevada disperso
(C.V. 30%).

Escore padronizado

Outra medida relativa de disperso o escore padronizado para uma


medida xi. dado por:

Zi =

x x
S
i

Onde: S = desvio padro amostral

x = mdia amostral
E Nemer

8 / 10

Estatstica - exEstatMedDisper.doc

25/02/09

Um escore Zi negativo indica que a observao xi est a esquerda da


mdia, enquanto um escore positivo indica que a observao est a direita
da mdia.

Exemplo 6: So dadas as mdias e os desvios padres das avaliaes de


duas disciplinas:

Portugus:

Matemtica:

= 6,5

SP = 1,2

= 5,0

SM = 0,9

Relativamente s disciplinas Portugus e Matemtica, em qual delas obteve


melhor performance um aluno com 7,5 em Portugus e 6,0 em
Matemtica?
Soluo: Vamos determinar os escores padronizados para as notas
obtidas:

Nota de Portugus:

Nota de Matemtica:

7,5 6,5
= 0,83
1,2

6,0 5,0
= 1,11
0,9

Portanto, o melhor desempenho relativo deu-se na disciplina Matemtica,


pois Zm > Zp. Observe que, em termos absolutos, o aluno conseguiu melhor
nota em Portugus.

E Nemer

9 / 10

Estatstica - exEstatMedDisper.doc

25/02/09

Detectando outliers

Nos trabalhos de coleta de dados, podem ocorrer observaes que fogem


das dimenses esperadas os outliers. Para detect-los, pode-se calcular
o escore padronizado (Zi) e considerar outliers as observaes cujos
escores, em valor absoluto (em mdulo), sejam maiores do que 3.

Exemplo 7: Os dados de uma pesquisa revelam mdia 0,243 e desvio


padro 0,052 para determinada varivel. Verificar se os dados 0,380 e
0,450 podem ser considerados observaes da referida varivel.

x = 0,243

Soluo: Tem-se que:

Para xi = 0,380:

0,380 0,243
= 2,63
0,052

Para xi = 0,455:

0,455 0,243
= 4,08
0,052

SP = 0,052

Portanto, o dado 0,380 pode ser considerado normal, por outro lado, 0,455
pode ser um outliers, portanto descartvel.

E Nemer

10 / 10

Você também pode gostar