2019 2 57 03 A 4676 41060 7 1

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 14

PROBABILIDADE E ESTATÍSTICA

Unidade 4

MEDIDAS SEPARATRIZES
E MEDIDAS DE DISPERSÃO

Conteúdos e Habilidades

As medidas separatrizes se enquadram dentro das medidas de


posição, já que são utilizadas para separar uma série de dados em “x”
partes iguais.

Definição
Medidas separatrizes são valores que separam o rol (dados
ordenados) em quatro, dez (decis) ou em cem (percentis) partes iguais.
Note que para a sua correta aplicação, exige-se que os dados estejam
organizados num rol.
Quartis (Q1)
Decis (D1)
Percentis ou Centis (C1)

Quartis (Q1)
São valores que dividem o conjunto de dados ordenados (rol) em
4 partes iguais (em cada uma das quatro partes tem-se 25% dos dados).
Para calcular os quartis é fundamental que a série de dados
esteja ordenada em ordem crescente (rol). Primeiramente, calcula-se a
mediana Q2(número central da série de dados) e, em seguida, obtém-se
dois subconjuntos, o da esquerda e o da direita da mediana. Portanto,
há 3 quartis:
Primeiro Quartil (Q1) – valor situado na série de dados à esquerda
da mediana (Q2) de tal modo que 25% das observações são menores
que ele e 75% são maiores.
Segundo Quartil (Q2) espaço a mais ou mediana – valor situado
de tal modo na série de dados que 50% das observações são menores
que ele e 50% são maiores.
Terceiro Quartil (Q3) – valor situado na série de dados à direita da
mediana de tal modo que 75% das observações são menores que ele e
25% são maiores.

53
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Exemplo: Oito pessoas aceitaram o desafio de fazer exercícios


para emagrecer e melhorar a saúde. No primeiro dia de pesagem, suas
massas, em kg, estão dadas na tabela a seguir. A partir desses dados,
determine os quartis.

Resolução:
Ordenando os valores, temos:

Como a quantidade total de elementos é par, a mediana (Q2) será


a média aritmética entre os elementos que se encontram nas posições
centrais do conjunto, neste caso, os elementos da 4ªe 5ªposições:

O primeiro quartil (Q1) será a média aritmética entre os elementos


que se encontram nas posições 2 e 3, ou seja:

O terceiro quartil (Q3) será a média aritmética entre os elementos


que se encontram nas posições 6 e 7, ou seja:

Decis (D1)
São valores que dividem o conjunto de dados ordenados (rol) em
10 partes iguais.
Primeiro Decil (D1) – valor situado de tal modo na série de dados
que 10% das observações são menores que ele e 90% são maiores.
Segundo Decil (D2) – valor situado de tal modo na série de dados
que 20% das observações são menores que ele e 80% são maiores.
Nono Decil (D9) – valor situado de tal modo na série de dados que
90% das observações são menores que ele e 10% são maiores.

54
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Percentis ou Centis (C1)


São valores que dividem o conjunto de dados ordenados (rol) em
100 partes iguais.
Primeiro Percentil (C1) – valor situado de tal modo na série
de dados que 1% das observações são menores que ele e 99% são
maiores.
Segundo Percentil (C2) – valor situado de tal modo na série
de dados que 2% das observações são menores que ele e 98% são
maiores.
Nonagésimo Nono Percentil (C99) – valor situado de tal modo na
série de dados que 99% das observações são menores que ele e 1%
são maiores.

Cálculo dos Quartis, Decis e Percentis


Roteiro para Cálculo:

1º Passo – Determinar as frequências acumuladas (fac) da


distribuição.

2º Passo – Calcular a posição do Quartil, Decil ou Percentil


desejado, por uma das fórmulas:

3º Passo – Identificar a que classe que contém o Quartil, Decil


ou Percentil desejado por meio da frequência acumulada simples
(fac).

4º Passo – Calcular o Quartil, Decil ou Percentil desejado por


meio de uma das fórmulas:

55
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Para Quartil:

Onde:
li →limite inferior da classe do quartil
fant →frequência acumulada anterior a classe do quartil
fQ →frequência simples da classe do quartil
h →amplitude de classe do quartil

Para Decil:

Onde:
li →limite inferior da classe do decil
fant →frequência acumulada anterior a classe do decil
fQ →frequência simples da classe do decil
h →amplitude de classe do decil

Para Percentil:

Onde:
li →limite inferior da classe do percentil
fant →frequência acumulada anterior a classe do percentil
fQ →frequência simples da classe do percentil
h →amplitude de classe do percentil

Exemplo: Os salários (em salário-mínimo) de 160 professores de


uma escola estão distribuídos conforme a tabela a seguir. Calcule o Q1,
D4 e o C85 e interprete os resultados.

56
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Solução:
1º Passo – Determinar as frequências acumuladas (fac) da
distribuição.
2º Passo – Calcular a posição do Quartil, Decil ou Percentil
desejado, por uma das fórmulas:

3º Passo – Identificar qual a classe que contém o Quartil, Decil


ou Percentil desejado por meio da frequência acumulada simples
(fac).
Quartil (segunda classe); Decil (terceira classe); Percentil (quarta
classe).

4º Passo – Calcular o Quartil, Decil ou Percentil desejado por


meio de uma das fórmulas:
Quartil:

Decil:

Interpretação: 40% dos professores da escola ganham até 5,13


salários-mínimos ou 60% dos professores ganham mais de 5,13
salários-mínimos.

Percentil:

Interpretação: 85% dos professores da escola ganham até 8,07


salários-mínimos ou 15% dos professores ganham mais de 8,07
salários-mínimos.

57
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Leitura Obrigatória

Medidas de Dispersão

São medidas estatísticas utilizadas para avaliar o grau de


variabilidade ou dispersão dos valores em torno de um valor central,
geralmente as médias. Servem para medir a representatividade das
medidas de tendência central.
Chamamos de dispersão ou variabilidade a maior ou menor
diversificação dos valores de uma variável em torno de um valor de
tendência central tomado como ponto de comparação.
Consideremos os seguintes conjuntos de valores sobre medidas
de peças em milímetros:

Tanto no conjunto 1 como no conjunto 2, a média é a mesma,


entretanto é fácil verificar que não há diferença entre os dados do
conjunto 1 (homogêneo) e no conjunto 2, há diferença, ou seja, a
dispersão deste conjunto não será nula.
As medidas de dispersão analisam o afastamento dos dados
em relação à média.

Amplitude total para dados não agrupados (quantidade de dados


inferior a 30 elementos)
É a diferença entre o maior e o menor valor da série de dados:

AT = nº maior - nº menor

Exemplo: Na série de dados a seguir, qual é a amplitude total?

AT = 35–19 = 16

58
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Amplitude total para dados não agrupados sem intervalo de classe


Neste caso, também é a diferença entre o maior e o menor valor
da série de dados:

AT = nº maior - nº menor

Exemplo: Num dia de operação de uma linha de produção, contou-


se a quantidade de defeitos em cada peça. Os dados estão distribuídos
na tabela a seguir. Qual é a amplitude total da distribuição?

AT = 4–1 = 3

Amplitude total para dados agrupados com intervalo de


classe (Dados agrupados são informações numéricas de tamanho
grande – maior que trinta elementos)
Neste caso, a amplitude total será a diferença entre o limite
superior da última classe e o limite inferior da primeira classe:

AT = LSmáx - LImín

Exemplo: Utilizando a distribuição de frequência dos dados de


depósitos bancários da empresa SONICK, determine a amplitude total
da distribuição.

AT = 4,3–0,8 = 3,5

59
PROBABILIDADE E ESTATÍSTICA
Unidade 4

A utilização da amplitude total, como medida de dispersão é


limitada, pois se resume apenas aos dados extremos, não considerando
possíveis variações dentro de uma série de dados.

Variância e Desvio Padrão para dados não agrupados


Como vimos, a amplitude total é limitada, por não considerar
os valores extremos. Para resolver essa limitação, podemos calcular
a variância e o desvio padrão, que levam em consideração todos os
valores da série de dados. Esse fato faz com que essas medidas sejam
muito estáveis e as mais utilizadas para explicar a dispersão de uma
série de dados.
A variância corresponde ao somatório do quadrado da diferença
entre cada elemento e a média aritmética do conjunto, dividido pela
quantidade de elementos (se for populacional) ou dividido pela
quantidade de elementos menos um (se for amostral). Quanto menor é
a variância, mais próximos os valores estão da média; mas quanto maior
ela é, mais os valores estão distantes da média.
O desvio padrão é a raiz quadrada da variância e é também
conhecido por dispersão absoluta. O desvio padrão é capaz de identificar
o “erro” em um conjunto de dados, caso quiséssemos substituir um dos
valores coletados pela média aritmética. Um baixo desvio padrão indica
que os pontos dos dados tendem a estar próximos da média ou do valor
esperado.
O desvio padrão aparece junto à média aritmética, informando o
quão “confiável” é esse valor. Ele é apresentado da seguinte forma:

média aritmética (x) ± desvio padrão (dp)

A unidade do desvio padrão é a mesma da variável em questão, Saiba Mais


já a unidade da variância é em unidade quadrada em relação à variável
em questão. A diferença entre os cálculos de
variância amostral e populacional
A variância e o desvio padrão são definidos por:
está na divisão por n e por n-1. Este
é um conceito complexo. Uma visão
sobre essa diferença pode ser vista no
seguinte vídeo:

< http://bit.ly/2LtvYWm >

60
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Para o cálculo da variância e desvio padrão amostral, deve-se


seguir os seguintes passos:

• Etapa 1: calcule a média dos dados;

• Etapa 2: subtraia a média de cada dado. Essas diferenças são


chamadas de desvios. Dados abaixo da média terão desvios
negativos, e dados acima da média terão desvios positivos;

• Etapa 3: eleve cada um dos desvios ao quadrado para torná-los


positivos;

• Etapa 4: some todos os desvios ao quadrado;

• Etapa 5: divida a soma pelo número de dados da amostra


menos um. O resultado é chamado de variância.

• Etapa 6: calcule a raiz quadrada da variância para obter o


desvio-padrão.

Exemplo: Utilizando os dados do conjunto de amostras sobre a


medida de peças em milímetros, calcule a variância e o desvio padrão
dos dados:

A variância para o conjunto de dados amostrais é 2,5.


Para o cálculo do desvio padrão basta tirar a raiz quadrada da
variância:

Portanto, o conjunto amostral em estudo apresenta:

61
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Quando há necessidade do cálculo da variância e desvio padrão


populacional, seguir os seguintes passos:

• Etapa 1: calcule a média dos dados;

• Etapa 2: subtraia a média de cada dado. Essas diferenças são


chamadas de desvios. Dados abaixo da média terão desvios
negativos, e dados acima da média terão desvios positivos;

• Etapa 3: eleve cada um dos desvios ao quadrado para torná-los


positivos;

• Etapa 4: some todos os desvios ao quadrado;

• Etapa 5: divida a soma pelo número de dados na população. O


resultado é chamado de variância;

• Etapa 6: calcule a raiz quadrada da variância para obter o


desvio-padrão.

Exemplo de cálculo de variância e desvio padrão populacional:


Quatro amigos estavam comparando as notas tiradas por eles em uma
recente atividade de redação. Calcule a variância e o desvio-padrão de
suas notas: 6, 2, 3, 1

A variância para o conjunto de dados populacional é 3,5.


Para o cálculo do desvio padrão basta tirar a raiz quadrada da
variância:

Portanto, o conjunto amostral em estudo apresenta:

62
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Variância e Desvio Padrão para dados agrupados sem e com


intervalo de classe
Neste caso, como os dados normalmente são apresentados
numa distribuição de frequência e esta, por sua vez, traz a frequência
de cada classe, devemos levá-la em consideração, ou seja, a variável
que está sendo estudada é considerada o xi e fi é a sua frequência. No
caso da distribuição ser com intervalos de classe, o ponto médio da
classe passa a ser o xi. Portanto, podemos definir a variância amostral
e o desvio padrão amostral para dados agrupados sem e com intervalo
de classe por:

Exemplo: Utilizando a distribuição de frequências mostrada no


quadro abaixo, sobre a quantidade de crianças residentes em cada
família entrevistada, determine a variância e o desvio padrão.

63
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Podemos, ainda, destacar as seguintes propriedades da variância


e do desvio padrão:

a) Multiplicando-se ou dividindo-se todos os valores de uma


variável por uma constante, a variância da série de dados fica
multiplicada ou dividida pelo quadrado dessa constante; e o
desvio padrão fica multiplicado ou dividido por essa constante;

b) Somando-se ou subtraindo-se uma constante a todos os


valores de uma variável, nem a variância e nem o desvio padrão
se alteram.

Coeficiente de variação
O coeficiente de variação também conhecido como dispersão
relativa é a razão entre o desvio padrão e a média aritmética da série
de dados, frequentemente expresso em porcentagem. Ele caracteriza a
dispersão dos dados em termos relativos ao seu valor médio.

Exemplo: Utilizando os dados do conjunto a seguir, calcule o


coeficiente de variação de dados.

Primeiramente devemos calcular a média e o desvio padrão do


conjunto e com os resultados, aplicá-los na fórmula do CV:

Observações: alguns analistas sugerem a seguinte classificação


do coeficiente de variação:

• Baixa variabilidade: CV < 15%

• Média variabilidade: 15% ≤ CV < 30%

• Alta variabilidade: CV ≥ 30%

64
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Finalizando GLOSSÁRIO
DADOS AGRUPADOS:
Nesta unidade foram estudadas as medidas separatrizes e
São informações numéricas de
medidas de dispersão. tamanho grande, ou seja, agrupam-
Dentre os temas estudados relacionados às medidas separatrizes, se dados quando a amostra é
destacam-se: considerada grande (n > 30). É
necessário agrupar os valores em
• Quartil; forma de classes para obtermos
informações representativas do
• Decil;
conjunto numérico todo.
• Percentil.
POPULAÇÃO:
É uma coleção de unidades
Essas medidas foram desenvolvidas no âmbito da estatística a
observacionais, que podem ser
fim de avaliar o grau de espalhamento dos dados (dispersão). pessoas, animais, objetos ou
Em relação às medidas de dispersão, foram estudadas: resultados experimentais, com uma
ou mais características em comum
• Amplitude; que se pretendem analisar.
• Variância;
AMOSTRA:
• Desvio padrão;
É um subconjunto da população,
• Coeficiente de variação. isto é, são dados que pertencem
a população e são usados para
análise e estudo da população
A Variância é uma medida de dispersão que mostra o quão
distante cada valor desse conjunto está do valor central (médio). Quanto
menor é a variância, mais próximos os valores estão da média; mas
quanto maior ela é, mais os valores estão distantes da média.
O desvio padrão é capaz de identificar o “erro” em um conjunto
de dados, caso quiséssemos substituir um dos valores coletados pela
média aritmética. Ele aparece junto à média aritmética, informando o
quão “confiável” é esse valor

Aplicando a Teoria na Prática


O estudo da estatística faz parte do cotidiano das pessoas. Em
ambientes acadêmicos, estes estudos têm uma importância acentuada
no estudo do comportamento e aproveitamento de cada estudante,
classe, curso.
Dessa forma propõe-se uma atividade onde se deve escolher um
grupo de alunos (Amostra da classe) e coletar a nota de 10 alunos de
uma matéria a se escolher. Calcule as medidas de dispersão estudadas
nesse capitulo (Variância, desvio padrão e coeficiente de dispersão).
Esse exercício servirá para aprimorar de forma prática o conhecimento
obtido na quarta unidade de estudo.

65
PROBABILIDADE E ESTATÍSTICA
Unidade 4

Referências

CARVALHO, C. Literacia Estatística do I Seminário de Ensino de


Matemática –14ªConferência realizada pelo COLE, Campinas (São
Paulo), 22-25 de julho de2003.

CRESPO, A. A Estatística Fácil – 17 ed. – São Paulo: Editora Saraiva,


2002.

LEVINE, M. D., STEPHAN, D., KREHBIEL, C. T., BERENSON, L.


Mark, Estatística-Teoria e Aplicação usando o Microsoft Excel em
Português, 3ª edição, TraduçãoURTOLO, E. B., SOUZA, T. C. P., LTC
Editora, Livros Técnicos Científicos EditoraS.A., 2005.

PLACKET, R. L. Studies in the History of Probability and Statistics:


VII. The Principle of the Arithmetic Mean. Biometrika: 130 – 135. 2016.

EISENHART, C. (1971). The Development of the Conceptof the


Best Mean of a set of Measurements from Antiquity to the Present
Day.1971

BAKKER, ARTHUR. The Early History of Average Values and


Implications for Education. Journal of Statistics Education: 17 – 26.
Consultado em 3 de novembro de 2016.

66

Você também pode gostar