Apostila IV - Medidas de Posição

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 11

Probabilidade e Estatística

Apostila IV

MEDIDAS DE POSIÇÃO

1. INTRODUÇÃO
O estudo que fizemos sobre distribuições de frequência, até agora, permite-nos
descrever, de modo geral, os grupos de valores que uma variável pode assumir. Dessa forma,
podemos localizar a maior concentração de valores de uma dada distribuição, isto é, se ela se
localiza no início, no meio ou no final da distribuição, ou ainda, se há uma distribuição por
igual.
Porém, para ressaltar as tendências características de cada distribuição, isoladamente ou
em confronto com outras, necessitamos introduzir conceitos que se expressem através de
números, que nos permitam traduzir essas tendências. Esses conceitos são denominados
elementos típicos da distribuição (CRESPO, 2002):
a. Medidas de posição;
b. Medidas de variabilidade ou dispersão;
c. Medidas de assimetria;
Dentre os elementos típicos, destacamos as medidas de posição, estatísticas que
representam uma série de dados, orientando-nos quanto à posição da distribuição em relação ao
eixo horizontal (eixo das abscissas).
As medidas de posição mais importantes são as medidas de tendência central, que
recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em
torno dos valores centrais (CRESPO, 2002). Dentre as medidas de tendência central,
destacamos:
a. A moda;
b. A mediana;
c. A média aritmética.

2. MEDIDAS DE POSIÇÃO

2.1. A Moda (Mo)


Denominamos Moda o valor que ocorre com maior frequência em uma série de valores.
Por exemplo, considerando os salários dos empregados de uma indústria, o salário modal é o
salário mais comum, isto é, o salário recebido pelo maior número de empregados (CRESPO,
2002).

1
Probabilidade e Estatística
Apostila IV

2.1.1. Dados Não-Agrupados


Quando lidamos com valores não-agrupados, a moda é facilmente reconhecida, basta, de
acordo com a definição, procurar o valor que mais se repete. A série de dados:
7, 8, 9, 10, 10, 10, 11, 12, 13, 15
tem moda igual a 10.
Podemos, entretanto, encontrar séries nas quais não exista valor modal, isto é, nas quais
nenhum valor apareça mais vezes que outros. É o caso da série:
3, 5, 8, 10, 12, 13
que não apresenta moda (amodal).
Em outros casos, ao contrário, pode haver dois ou mais valores de concentração.
Dizemos, então, que a série tem dois ou mais valores modais. Na série:
2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9
temos duas modas: 4 e 7 (bimodal).

2.1.2. Dados Agrupados sem Intervalos de Classe


Uma vez agrupados os dados, é possível determinar imediatamente a moda, basta fixar o
valor da variável de maior frequência. Consideremos a distribuição relativa a 34 famílias de um
determinado conjunto habitacional, tomando para variável o número de filhos do sexo
masculino:
Tabela 2.1
N° de Meninos fi

0 2
1 6
2 10
3 12
4 4
∑ = 34

Na distribuição da Tabela 2.1, à freqüência máxima 12 corresponde o valor 3 da variável.


Logo:
Mo = 3

2
Probabilidade e Estatística
Apostila IV

2.1.3. Dados Agrupados com Intervalos de Classe


A classe que apresenta a maior frequência é denominada classe modal. Pela definição,
podemos afirmar que a moda, neste caso, é o valor dominante que está compreendido entre os
limites da classe modal.
O método mais simples para o cálculo da moda consiste em tomar o ponto médio da
classe modal (CRESPO, 2002). Temos, então:

Mo =
onde:
ℓ* é o limite inferior da classe modal;
L* é o limite superior da classe modal.
Assim, para a distribuição:

Tabela 2.2
i Estaturas fi

1 150 |– 154 4
2 154 |– 158 9
3 158 |– 162 11 classe modal
4 162 |– 166 8
5 166 |– 170 5
6 170 |– 174 3
∑ = 40

temos que a classe modal é i = 3, ℓ* = 158 e L* = 162. Então:

Mo = = = = 160 cm

2.1.4. Emprego da Moda


A moda é utilizada:
• quando desejamos obter uma medida rápida e aproximada de posição;
• quando a medida de posição deve ser o valor mais típico da distribuição.

2.2. A Mediana (Md)


A mediana é outra medida de posição definida como o número que se encontra no
centro de uma série de números, estando estes dispostos segundo uma ordem. Em outras
palavras, a mediana de um conjunto de valores, ordenados segundo uma ordem de grandeza, é o

3
Probabilidade e Estatística
Apostila IV

valor situado de tal forma no conjunto que o separa em dois subconjuntos de mesmo número de
elementos (CRESPO, 2002).

2.2.1. Dados Não-Agrupados


Dada uma série de valores, como, por exemplo:
5, 13, 10, 2, 18, 15, 6, 16, 9
de acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação (crescente
ou decrescente) dos valores:
2, 5, 6, 9, 10, 13, 15, 16, 18
Em seguida, tomamos aquele valor central que apresenta o mesmo número de elementos
à direita e à esquerda. Em nosso exemplo, esse valor é o 10, já que, nessa série, há quatro
elementos acima dele e quatro abaixo.
Temos então:
Md = 10
Se, porém, a série dada tiver um número par de termos, a mediana será, por definição,
qualquer um dos números compreendidos entre os dois valores centrais da série. Convencionou-
se utilizar o ponto médio.
Assim, a série dos valores:
2, 6, 7, 10, 12, 13, 18, 21
tem para mediana o ponto médio entre 10 e 12. Logo:

Md = = = 11
Verificamos que, estando ordenados os valores de uma série e sendo n o número de
elementos da série, o valor mediano será:

• O elemento de ordem , se n for ímpar;

• O ponto médio entre os elementos de ordem e + 1, se n for par.

Podemos comprovar tal fato nas séries dadas anteriormente:


— Para a série {2, 5, 6, 9, 10, 13, 15, 16, 18}, temos n = 9 e, consequentemente,

= = 5. Logo, a mediana é o 5° elemento da série, isto é: Md = 10.

4
Probabilidade e Estatística
Apostila IV

— Para a série {2, 6, 7, 10, 12, 13, 18, 21}, temos n = 8 e, consequentemente, =
= 4, e +1= + 1 = 5. Logo, a mediana é o ponto médio entre o 4° e 5°

elementos da série, isto é: Md = = = 11.

Notas:
• O valor da mediana pode coincidir ou não com um elemento da série, como vimos.
Quando o número de elementos da série é ímpar, há coincidência. O mesmo não
acontece, porém, quando esse número é par.
• A mediana e a média aritmética não têm, necessariamente, o mesmo valor.
• A mediana, como vimos, depende da posição e não dos valores dos elementos na
série ordenada. Essa é uma das diferenças marcantes entre a mediana e a média (que
se deixa influenciar, e muito, por valores extremos).

2.2.2. Dados Agrupados sem Intervalos de Classe


Se os dados se agrupam em uma distribuição de frequência, o cálculo da mediana se
processa de modo muito semelhante àquele dos dados não-agrupados, implicando, porém, a
determinação prévia das frequências acumuladas. Ainda aqui, temos que determinar um valor
que divida a distribuição em dois grupos que contenham o mesmo número de elementos. Para o
caso de uma distribuição, porém, a ordem é dada por:

Quando a distribuição de frequência é sem intervalos de classe, é o bastante identificar a


frequência acumulada que contenha a metade da soma das frequências. A mediana será aquele
valor da variável que corresponde a tal frequência acumulada (CRESPO, 2002).
Tomemos a distribuição relativa à Tabela 2.1, completando-a com a coluna
correspondente á frequência acumulada:
Tabela 2.3
N° de Meninos fi Fk
0 2 2
1 6 8
2 10 18
3 12 30
4 4 34
∑ = 34
5
Probabilidade e Estatística
Apostila IV

Sendo:

= = 17

a frequência acumulada que contém a metade da soma da frequências é 18, que corresponde ao
valor 2 da variável, sendo este o valor mediano. Logo:
Md = 2 meninos

Nota:
• No caso de existir uma frequência cumulada (Fi), tal que:

Fi =
a mediana será dada por:
Md =
isto é, a mediana será a média entre o valor da variável correspondente a essa frequência
acumulada e o seguinte. Exemplo:

Tabela 2.4
xi fi Fk
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
∑=8

Temos:

= = 4 = F3
Logo:

Md = =

Md = = = 15,5

2.2.3. Dados Agrupados com Intervalos de Classe


Nesse caso, o problema consiste em determinar o ponto do intervalo em que está
compreendida a mediana. Para tanto, temos inicialmente que determinar a classe na qual se acha

6
Probabilidade e Estatística
Apostila IV

a mediana – classe mediana. Tal classe será, evidentemente, aquela correspondente à frequência

acumulada que contém (CRESPO, 2002). Depois de definida a classe mediana, a moda será

dada por:

Md = ℓ* +

na qual:
ℓ* é o limite inferior da classe mediana;
F(ant) é a frequência acumulada da classe anterior à classe mediana;
f* é a frequência simples da classe mediana;
h* é a amplitude do intervalo da classe mediana.
Considerando a distribuição da Tabela 2.2, acrescida das frequências acumuladas:

Tabela 2.5
i Estaturas fi Fi

1 150 |– 154 4 4
2 154 |– 158 9 13
3 158 |– 162 11 24 classe mediana
4 162 |– 166 8 32
5 166 |– 170 5 37
6 170 |– 174 3 40
∑ = 40

temos:

= = 20

Logo, a classe mediana é a de ordem 3. Então:


ℓ* = 158, F(ant) = 13, f* = 11 e h* = 4
Substituindo esses valores na fórmula, obtemos:

Md = 158 +

Md = 158 + = 158 + 2,54

Md = 160,54 cm

7
Probabilidade e Estatística
Apostila IV

Nota:

• No caso de existir uma frequência acumulada exatamente igual a , a mediana


será o limite superior da classe correspondente. Exemplo:

Tabela 2.6
i Classes fi Fk

1 0 |– 10 1 1
2 10 |– 20 3 4
3 20 |– 30 9 13
4 30 |– 40 7 20
5 40 |– 50 4 24
6 50 |– 60 2 26
∑ = 26

Temos:

= = 13
Logo:
Md = L* = 30

2.2.4. Emprego da Mediana


Empregamos a mediana quando:
• desejamos obter o ponto que divide a distribuição em partes iguais;
• há valores extremos que afetam de uma maneira acentuada a média.

2.3. A Média Aritmética ( )


Em um conjunto de dados, podemos definir vários tipos de médias. Porém, em nossos
estudos iremos nos limitar à mais importante: a média aritmética.
Média aritmética é o quociente da divisão entre a soma dos valores da variável pelo total
de valores (CRESPO, 2002):

onde xi são os valores da variável e n é o total de valores.

8
Probabilidade e Estatística
Apostila IV

2.3.1. Dados Não-Agrupados


Quando desejamos conhecer a média dos dados não-agrupados, determinamos a média
aritmética simples.
Exemplo: Sabendo-se que a produção de asfalto diária da empresa A, durante uma
semana, foi de 510, 514, 513, 515, 516, 518 e 512 quilogramas, temos, para produção média da
semana:

Às vezes, a média pode ser um número diferente de todos os números da série de dados
que ela representa. É o que acontece quando temos, por exemplo, os valores 2, 4, 8 e 9, para os
quais a média é 5. Esse será o número representativo dessa série de valores, embora não esteja
representado nos dados originais. Neste caso, costumamos dizer que a média não tem
existência concreta (CRESPO, 2002).

2.3.2. Dados Agrupados sem Intervalos de Classe


Neste caso, como as frequências são números indicadores da intensidade de cada valor
da variável, elas funcionam como fatores de ponderação, o que nos leva a calcular a média
aritmética ponderada, dada pela fórmula (CRESPO, 2002):

Voltemos a distribuição relativa à Tabela 2.1. O modo mais prático de obtenção da


média ponderada é abrir, na tabela, uma coluna correspondente aos produtos xifi:

Tabela 2.7
N° de Meninos fi xifi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
∑ = 34 ∑ = 78

Temos, então:
∑xifi = 78 e ∑fi = 34
Logo:

9
Probabilidade e Estatística
Apostila IV

= = 2,29

2,3 meninos

2.3.3. Dados Agrupados com Intervalos de Classe


Neste caso, convencionamos que todos os valores incluídos em um determinado
intervalo de classe coincidem com o seu ponto médio, e determinamos a média aritmética
ponderada por meio da fórmula (CRESPO, 2002):

onde xi é o ponto médio da classe.


Voltemos a distribuição relativa à Tabela 2.2. Pela mesma razão do caso anterior, vamos,
inicialmente, abrir uma coluna para os pontos médios e outra para os produtos xifi:

Tabela 2.8
i Estaturas fi xi xifi

1 150 |– 154 4 152 608


2 154 |– 158 9 156 1.404
3 158 |– 162 11 160 1.760
4 162 |– 166 8 164 1.312
5 166 |– 170 5 168 840
6 170 |– 174 3 172 516
∑ = 40 ∑ = 6.440

Como, neste caso:


∑xifi = 6.440 e ∑fi = 40
temos então:

= = 161 cm

2.3.4. Emprego da Média


A média é utilizada quando:
• desejamos obter a medida de posição que possui a maior estabilidade;
• houver necessidade de aplicação de um tratamento algébrico aos dados;
• não há valores extremos.

10
Probabilidade e Estatística
Apostila IV

2.4. Posição Relativa da Média, Mediana e Moda


Quando uma distribuição é simétrica, as três medidas coincidem. Porém, a assimetria
torna-as diferentes e essa diferença é tanto maior quanto maior é a assimetria. Assim, em uma
distribuição em forma de sino, temos (CRESPO, 2002):
= Md = Mo, no caso da curva simétrica;

Mo < Md < , no caso da curva assimétrica positiva;

< Md < Mo, no caso da curva assimétrica negativa.

= Md = M o

Mo < Md < < M d < Mo

3. REFERÊNCIA BIBLIOGRÁFICA
• CRESPO, A. A. Estatística Fácil. 17ª edição. São Paulo: Editora Saraiva, 2002.

11

Você também pode gostar