Bio e Statistic A

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 122

UNIVERSIDADE DE PERNAMBUCO - UPE

Reitor
Prof. Emanuel Dias de Oliveira e Silva

Vice-Reitor
Prof. Armando Carneiro Pereira do Rêgo Filho

Pró-Reitor Administrativo
Prof. Glêdeston Emerenciano de Melo

Pró-Reitor de Planejamento
Prof. Béda Barkokébas Jr.

Pró-Reitor de Graduação
Prof. José Guido Corrêa de Araújo

Pró-Reitora de Pós-Graduação e Pesquisa


Profª. Aronita Rosenblatt

Pró-Reitor de Desenvolvimento Institucional e Extensão


Prof. Reginaldo Inojosa Carneiro Campello

NEED - NÚCLEO DE ESTUDO EM EDUCAÇÃO A DISTÂNCIA

Coordenador Geral
Prof. Renato Medeiros de Morais

Coordenação Padagógica
Profª Rute Cândida Pereira
Profª Maria Vitória Ribas de Oliveira Lima
Profª Aidy Araújo Guedes
Profª Nara Carneiro Lacerda

Coordenação de Revisão Gramatical


Profª Angela Maria Borges Cavalcanti
Profª Eveline Mendes Costa Lopes
Profª Patrícia Lídia do Couto Soares

Capa e Projeto Gráfico


Marcos Leite

Arte Final
Rinaldo Afonso de Lemos
Romeu Santos Jr.

Impresso no Brasil - Tiragem 360 exemplares

Av. Agamenon Magalhães, s/n - Santo Amaro


Recife / PE - CEP. 50103-010 - Fone: (81) 3416.4041 - Fax: (81) 3416.4014
Introdução à Bioestatística FASCÍCULO

Carga Horária - 10 horas


Gilberto Pereira da Silva
Mário de Souza 1
Objetivos

-Compreender a natureza do trabalho estatístico e sua origem,


como forma de apropriar-se da linguagem estatística;
- Entender a necessidade do processo de modelagem matemática junto à
estatística, como formas de compreender enunciados, formular questões ou
levantar hipóteses e prever resultados, com uso de argumentos dentro de uma
linguagem matemática, para uso desse fato em situações reais.

- Compreender os conceitos fundamentais de estatística, as fases do trabalho


estatístico e as aplicações/apurações de dados da estatística em fatos vitais, como
forma de desenvolver a capacidade de utilizar a matemática na
UPE - Universidade de Pernambuco

interpretação e intervenção do real.

Introdução

Quando você vai comprar, por exemplo, um aparelho de televisão, você antes de
comprar faz, em princípio, algumas perguntas, tais como: “Por que quero comprar
um aparelho de televisão? Que marca devo comprar? Qual o tempo de utilização
desse aparelho com esta ou aquela marca de interesse, sem que ele vá ao reparo? De
quantas polegadas eu quero este aparelho de televisão? Posso comprar a vista ou a
1 prazo? Se for a prazo, qual o melhor investimento que devo fazer?”, e assim por
diante. Às vezes até se consultam outras pessoas sobre o referido aparelho de
04 escolha ou um especialista sobre consertos de televisão.
NEED - Núcleo de Estudo em Educação a Distância

Quando você está fazendo isto ou algo parecido, você está levantando dados para
tomar uma decisão. Mas, antes de você tomar a decisão, você sempre faz uma análise
das informações obtidas durante o teu processo de solução do problema central:
comprar um aparelho de televisão. Vale salientar que outras variáveis podem ocorrer
neste processo de escolha.

Exercício 1.1

Elabore as perguntas que você faria, no desejo de comprar um computador pessoal.


Seriam estas perguntas, as mesmas que você faria se o computador fosse para uso
em uma empresa na qual você seria o proprietário? Justifique suas respostas.

Assim sendo, aqui temos um problema: identificar as variáveis. E, estes dados que
poderão ser obtidos (identificados), junto às amostras que estou a consultar. Ou seja,
entendo estas identificações de variáveis e levantamento de dados como um
problema de estatística.
Assim, podemos compreender o trabalho estatístico como sendo um processo de
“pesquisa estatística, que envolve amostras, levantamentos de dados e análise das
informações obtidas” (PCN+EM, 2002, p. 126). Embora estejamos a trabalhar um
exemplo muito singular, fazemos salientar que ele serve de alicerce para a
compreensão do significado do trabalho estatístico, dentro (também) de um
processo histórico.

UPE - Universidade de Pernambuco


E, como a estatística trabalha com problemas da vida real, logo, a linguagem
matemática deve ser coerente com as necessidades do problema em estudo, daí a
necessidade da modelagem matemática para a compreensão do contexto de
interesse estatístico. E, nesse sentido, faz bem conhecermos um pouco da origem da
palavra matemática respondendo a questão “o que é a estatística?” Como forma de
nos aperceber da concatenação existente entre essas duas ciências.

Nessa direção, fazemos ver que os conceitos fundamentais em estatística jogam um


papel importante no processo de sua aprendizagem nesta disciplina, pois eles
1
constituem o princípio de formação de competências (no sentido cognitivo), para
apropriar-se desta linguagem e, assim sendo, você poder criar habilidades no sentido
05
de trabalhar os problemas estatísticos, criando argumentos concisos dentro de uma

NEED - Núcleo de Estudo em Educação a Distância


linguagem específica, a estatística aplicada à biologia, ou seja, a bioestatística.

Compreendendo a Natureza do Trabalho


Estatístico e sua Origem

Provavelmente, você deve ter acompanhado, ou até mesmo, apenas percebido,


algumas notícias sobre as últimas eleições para prefeito nas principais capitais do
Brasil, através do jornal televisionado, (embora outras mídias tenham publicado
sobre o fato, a televisiva tem uma influência maior que a escrita neste momento de
campanha eleitoral). E, nestes noticiários, para uma específica capital brasileira eram
apresentados, por exemplo, os últimos três dados coletados e apresentados num
gráfico que mostrava uma tendência de comportamento do eleitor quanto à escolha
(ou preferência) de um certo candidato a outro. Evidentemente, estes resultados
possibilitam uma previsão analítica de vitória de um candidato sobre o outro (ou
outros). E, durante o processo de coletas de dados e de informação pública, decisões
e inferências acerca do comportamento político são mudadas com bases, também,
nesses trabalhos experimentais de coletas de dados, ou seja, nas informações
estatísticas.

Sendo assim, ao dar início ao estudo da estatística, você está se deparando com uma
1
das parcelas do conhecimento humano, hoje dotado de um processo de
UPE - Universidade de Pernambuco

sistematização ou atitude científica, esmerada num trabalho experimental de coleta


de dados, que se constitui como sendo um dos elementos do trabalho estatístico. Ou
seja, a estatística tornou-se um conhecimento transformado num saber científico,
cuja finalidade é a elaboração de modelos matemáticos que servirão como
instrumentos de análise, decisão ou previsão, tomando como base as informações
antes coletadas. Isto possibilita o fornecimento de subsídios às possíveis análises de
resultados e/ou tomadas de decisões (ou previsões) sobre um determinado objeto de
estudo analítico/experimental, concatenado, evidentemente, com as informações
antes coletadas.

1 Este fato, exposto de forma generalizada no contexto acima, é, na verdade, uma


construção humana, como é todo o saber científico. Sendo assim, vamos,
06 inicialmente compreender como se estabeleceu, de um modo geral, a origem de seu
nome, indo do nascer da escrita até a origem e uso da palavra estatística.
NEED - Núcleo de Estudo em Educação a Distância

Sendo a escrita uma das maiores invenções humanas, podemos pensar, então, que
os registros dessa habilidade humana conduziram o homem a informar e comunicar
através da grafia. E, no início dessas grafias, as amostras da representação social e
cultural de um povo se sobressaíram, como expressão de uma sociedade.

Para se ter uma idéia desse fato, basta ver como essas grafias representadas em
pedras, ossos, madeiras, dentre outras formas de suporte físico para materializar um
símbolo (código), se formaram ao longo do tempo em escritas (antes conhecida
como mitografia, pois serviam a uma comunicação imediata através da pictografia)
sintética e ideográfica.

Possivelmente, esses elementos simbólicos representam um sistema gráfico, isto é,

1- Como este é um trabalho cuja referência é educacional, faz-se necessário saber fazer a distinção entre conhecimento e saber. “Enquanto
o saber está relacionado ao plano histórico da produção de uma área disciplinar, o conhecimento é considerado mais próximo do
fenômeno da cognição, estando submetido ao vínculo da dimensão pessoal do sujeito empenhado na compreensão de um saber” (PAIS,
2001, p. 36).
uma idéia, fato que se concebe hoje como formas de linguagens. Desse modo, pode-
se compreender a estatística como uma ciência milenar, uma vez que expressões
gráficas, decifradas ao longo da história da humanidade, nos informaram a respeito
de trabalhos baseados em coletas de dados, como “podemos mencionar os dados
estatísticos gravados em monumentos egípcios que permitem avaliar as condições
econômicas do Estado e os movimentos das populações e os encontrados nas
bibliotecas de Assurbanipal, que informam sobre a hierarquia dos funcionários
públicos e sobre a população das províncias do Império Assírio” (MILONE &
ANGELINI, 1993, p. 22), isto cerca de 3000 anos a.C.

UPE - Universidade de Pernambuco


Como esses assuntos dizem respeito ao estado (states), possivelmente o termo
estatística (statistics) se origina deste termo. O uso desta palavra aparece pela
primeira vez, no século XVI, na escola alemã, pelo economista Gottfried Achenwall
(1719 1772), da Universidade de Göttingen, que, “segundo Peters (1987: 79) e
Walker (1929: 32), foi o momento em que se utilizou a palavra alemã Statistik em
1749, e o uso deste termo na literatura inglesa fora em 1791 devido aos trabalhos de
John Sinclair (1754 1835)2” (ZAR, 1999, p. 1).

Assim, podemos compreender a natureza do trabalho estatístico como sendo um 1


estudo de fenômenos coletivos, cuja finalidade está atrelada à criação de modelos
matemáticos para possibilitar uma interpretação das relações funcionais entre os 07
modelos matemáticos e os resultados apresentados e/ou esperados dos fenômenos

NEED - Núcleo de Estudo em Educação a Distância


(regulares ou atípicos), ou seja, criam-se os métodos (modelos) estatísticos ou os
métodos de pesquisas estatísticas. Por exemplo, numa sala de aula você enquanto
professor observa, através de levantamento de dados, que em sua disciplina, durante
os três últimos anos a nota individual de cada um de seus alunos, neste mesmo
período, variou de 3,5 até 9,8. Então você tem um modelo linear, cuja representação
pode ser do tipo f(x) = 3,5 + x, com a variável x, estando no intervalo 0 x 5,3. Faz-se
necessário saber que esses métodos (modelos) estatísticos são considerados na
literatura estatística como sendo, pela primeira vez, enunciados em um dos trabalhos
de Gottfried Achenwall, intitulado Staatsverfassung der heutingen vornehmsten
europäischen Reichen (Constituições dos principais países da Europa) em 1752,
quando este faz uma relação entre a estatística e as disciplinas sociais.

Exercício 1.2

Descreva como você compreende um modelo matemático. Após a sua descrição,

2 - Tradução livre por Gerson Henrique da Silva .


elabore um exemplo onde esteja presente a compreensão da modelagem
matemática.

Modelagem Matemática e Modelos Estatísticos

Já nos reportamos à concatenação entre as atitudes científicas da análise


experimental de coletas de dados e a formulação matemática, através de uma
arquitetura própria dessa disciplina (expressão numérica, uma equação algébrica,
UPE - Universidade de Pernambuco

uma tabela, um gráfico, uma diagramação ou um programa computacional) como


formas de apresentar um auxílio à solução para um problema em estudo.

Como a estatística lida com problemas da vida real, logo se sabe que a complexidade
desses problemas dentro de um contexto de interesse necessita ser trabalhada
dentro de uma perspectiva de tornar o ato complexo do contexto de interesse numa
versão simplificada, através de um modelo matemático. O fato interessante é que
esse modelo matemático-estatístico deve levar em conta a maior parte dos detalhes
de interesse do contexto ou da situação pesquisada na qual o problema está inserido.
1
No processo de aprendizagem dessa disciplina, você irá se familiarizar com a
08 variedade dos modelos estatísticos (ou modelos matemáticos). Só como exemplo, a
descrição de gráficos e tabelas com dados numéricos referem-se aos modelos da
NEED - Núcleo de Estudo em Educação a Distância

estatística, denominada de estatística descritiva.

Assim, pode-se dizer que o ato de modelagem matemática é “um processo artístico,
visto que, para se elaborar um modelo, além do conhecimento de matemática, o
modelador precisa ter uma dose significativa de intuição e criatividade para
interpretar o contexto” (BIEMBENGUT & HEIN, 2000, p. 12). Além disso, podemos
compreender “que cada tipo de modelo é sempre incompleto, de alguma forma, pois
se refere, apenas, à parte do problema” (STEVENSON, 1981, p. 5), ou seja, uma parte
3
da complexidade . Isso nos faz ver que os problemas da vida real e a matemática são
conjuntos diferentes. Logo, a modelização é um processo de formação de uma
linguagem que possivelmente forneça uma representação do contexto, ou seja,
forme um conceito para nos possibilitar que seja estabelecida uma linguagem com o
mundo real, embora de forma complexa (que é diferente de complexidade). Temos
assim:

3 - “A complexidade não é complicação. O que é complicado pode reduzir-se a um princípio simples, mas a complexidade encontra-se
própria base” segundo Morin, Ciurama & Motta, 2003, pp. 44-5).
MODELAGEM MATEMÁTICA

SITUAÇÃO REAL MATEMÁTICA

MODELO

UPE - Universidade de Pernambuco


O trabalho, no processo de modelagem matemática, está constituído de três etapas.
Vejamos, então, essas etapas e suas subetapas, segundo (BIEMBENGUT & HEIN,
2000, p. 13):

a) Interação
-Reconhecimento da situação-problema;
-Familiarização com o assunto a ser modelado (referencial teórico).
1
b) Matematização
-Formulação do problema (hipótese);
09

NEED - Núcleo de Estudo em Educação a Distância


-Resolução do problema em termos do modelo.

c) Modelo Matemático
-Interpretação da solução;
-Validação do modelo (avaliação).

Situação Problema

As situações problemas caracterizam-se por recortes de um domínio complexo, cuja


realização implica mobilizar recursos, tomar decisões e ativar esquemas (apud
MACEDO, 2002, p. 114 em PERRENOUD, 1997, 2000). Onde, por esquema quero
explicitar uma estrutura interna de pensamento, ou seja, “é uma estrutura de
informação para representar os conceitos gerais guardados na memória [...] Um

5 - Apresentação simplificada, do texto original (apresentado no livro), feita por Gerson Henrique da Silva.
esquema contém, como parte de sua especificação, a rede de intercorrelações que se
acredita estar normalmente entre os constituintes do conceito em questão”
(RUMELHART, 1980: 33-34. Apud NÖTH, 1998).

Logo, podemos definir modelo como sendo “uma versão simplificada de algum
problema ou situação da vida real destinado a ilustrar certos aspectos do problema,
4
sem levar em conta todos os detalhes” (STEVENSON, 1981, p. 5) , ou seja, é um
trabalho complexo retirado de uma complexidade maior, que é a vida real, ou seja,
UPE - Universidade de Pernambuco

modelamos, apenas, um contexto.

Ainda, acerca dos modelos, podemos dizer que (op. cit. p. 5):

a) Utilidades
-Servem para comunicar uma idéia ou conceito.

b) Quanto ao seu uso


1 -Servem como uso de padrões de comparação.

10
c) Quanto ao seu envolvimento
NEED - Núcleo de Estudo em Educação a Distância

-Servem para envolver processos padronizados de solução.

d) Características
-Servem para testar idéias antes de implementá-las;
-Servem para quantificar e formalizar o que se conhece da situação-problema.

Esses aspectos, aqui apresentados, sugerem você pensar numa compreensão maior
da idealização de modelos, que transcorreu em sua vida acadêmica na escola de nível
Fundamental e Médio. Por exemplo, em Geografia o Globo Terrestre é um modelo da
Terra. Os manequins são modelos de pessoas. Assim, ao fazer uso de bolinhas numa
determinada urna, posso compreender como sendo um modelo de determinados
elementos contidos num recipiente ou numa área. Por exemplo, o número de
bactérias (bolinhas) contidas na boca de um ser vivo (urnas). Só que, nesse último
caso, há necessidade de outros elementos para justificar o processo de medição.
Mas, sua apresentação serve, apenas, para ilustrar a importância da modelização em
matemática, e aqui, especificamente, para a estatística.

Exercícios 1.3

-Como você diferencia um problema de um exercício? Justifique sua resposta.


-O que você compreende por hipótese? Dê exemplos.

UPE - Universidade de Pernambuco


O Que é Estatística?

Uma vez que já compreendemos a origem da palavra e natureza de seu trabalho,


vimos que esse processo de construção está ligado à vida real e, para fazer
compreender o contexto em que se materializa a interpretação do fato (situação-
problema), necessita-se de um conceito, ou seja, da criação de uma linguagem
(códigos) para comunicar/informar a realidade em estudo. Sendo assim, precisa-se
fazer um trabalho de modelagem, ou seja, tomar uma parte da complexidade do
problema e estruturá-lo dentro de um contexto racional de modelização matemática, 1
como forma de poder expressar os resultados estatísticos (buscados num trabalho
experimental de interesse específico). Compreendido isto, vem agora a pergunta: o 11
que é estatística?

NEED - Núcleo de Estudo em Educação a Distância


Antes de responder essa questão, vamos compreender o significado de matemática,
pois, ao estudar estatística, estamos fazendo matemática. O termo matemática tem
duas raízes: “matema que vai direção de explicar, de conhecer, de entender; e tica,
que se origina de techne que é a mesma raiz de arte e de técnica” (D'AMBROSIO,
1998, p. 5). Assim, podemos dizer que a matemática “é a arte de explicar, conhecer,
5
de entender...” (op. cit. p. 5) a natureza . E, dentro desse contexto, é que se estrutura
a estatística. Deste modo, podemos dizer que:

6
Estatística é uma atividade científica relacionada à obtenção de informações, a partir
de um corte na complexidade da realidade, com a busca experimental partindo das
coletas de dados, para que, com estas informações, seja possível criar um modelo
matemático (estatístico), com a finalidade de efetuar inferências a respeito da
população, como forma de comunicar o resultado esperado (ou não), a partir dos
dados coletados.
5 - Aqui o termo natureza vai além da concepção dos elementos de convívio real (no sentido de estar ligado aos cinco sentidos humanos),
indo, também, para o mundo do invisível e das relações compreendidas e elaboradas no mundo da cognição.
6 - A construção desse conceito fora adaptada a partir do conceito de estatística apresentado por Mendenhall, no livro Probabilidade e
Estatística, da Editora Campus, 1985, na página 17.
7 - Adaptados do texto de Stevenson, no livro Estatística Aplicada à Administração, da Editora Harbra, de 1981, na p.2.
Com essa definição de estatística, podemos agora compreender o significado de
bioestatística, uma estatística voltada para as análises dos aspectos que envolvem
vida. Assim, o ambiente de pesquisa está voltado para a área de saúde juntamente
com as profissões que envolvem as ciências biológicas.

Os Ramos da Estatística7

A descrição dos ramos da estatística serve de base para você melhor se situar no
UPE - Universidade de Pernambuco

contexto de seu trabalho estatístico, numa análise de dados que podem estar em suas
mãos, ou seja, você se apropriando de uma linguagem específica da estatística.

Estatística Descritiva

É a parte da estatística que utiliza os números para descrever os fatos. Em geral, esses
dados coletados são apresentados em forma de tabelas e/ou gráficos (histogramas).

1 Probabilidade

12 É a parte da estatística que utiliza o acaso (aleatório ou randônico), para se basear e


NEED - Núcleo de Estudo em Educação a Distância

construir o resultado matemático. Em geral, necessita-se de um grande número de


resultados experimentais (experimentos aleatórios).

Inferência

É a parte da estatística que diz respeito à análise e interpretação dos dados amostrais.
Necessita de conceitos e métodos estatísticos, para entender o que está ocorrendo
com a amostra, tendo como premissa básica a ocorrência aleatória da amostragem.

Conceitos Fundamentais em Estatística

Como toda ciência, a estatística tem sua linguagem própria. E esta linguagem deve
ser absorvida pelo estudante como forma de melhor trabalhar a compreensão e as
habilidades necessárias ao desenvolvimento da aprendizagem dessa disciplina. Para
isso, vamos compreender os conceitos de população e amostra (MENDENHALL,
1985, pp. 14-5).

População

É o conjunto que representa todas as medidas de interesse para o coletor de


amostras. Por exemplo, todas as notas de todos alunos(as) de uma escola básica.

UPE - Universidade de Pernambuco


Amostra

É um subconjunto de medidas extraídas da população de interesse. Por exemplo,


considerando a escola básica (anterior), retirar as notas dos alunos(as) da oitava série
do Ensino Fundamental e da primeira série do Ensino Médio da disciplina
Matemática.

Vejamos um outro exemplo para melhor entender este fato. Durante a campanha 1
para a presidência da República do Brasil, em 2002, as empresas de pesquisa
informavam e mostravam os gráficos de tendências de desempenho de cada 13
candidato. Como o resultado tinha uma relevância nacional, podia-se pensar que os

NEED - Núcleo de Estudo em Educação a Distância


dados coletados fossem consultados com toda a população que poderia votar. De
fato, isso não acontece. É inviável financeiramente e, além disso, teríamos de gastar
muito tempo para nos apoderarmos das opiniões de todos os eleitores. Então, diante
desse impasse, resolve-se conhecer da população que poderia votar, uma amostra. E,
com esta amostra, faz-se um estudo estatístico. Fato parecido você deve pensar, caso
desejasse consultar, em Pernambuco, o número de pessoas com AIDS. Será que você
deveria consultar toda a população do estado? Como você resolveria este problema?

Além desses dois conceitos, existem outros que você deve compreender. Vejamos:

Variável

Denomina-se de variável uma quantidade ou categoria de interesse no estudo


estatístico.
Exemplos:
a) idade;
b) renda da família;
c) cor da pele;
d) pressão sistólica versus idade;
e) intensidade de dor.
UPE - Universidade de Pernambuco

Tipos de variáveis:

Nominal (Tipo sangüíneo: A, B, AB ou O)


CATEGÓRICAS
Ordinal (Hipertenso: leve, moderado, grave ou normal)

Discretas (Número de bactérias em um volume de urina)


1 QUANTITATIVAS
Contínuas (Pressão sangüínea, peso, altura)
14
NEED - Núcleo de Estudo em Educação a Distância

Observações:

Além desses tipos, pode-se também descrever um tipo interessante que é aquele que
apresenta por si mesmo, apenas, dois resultados. É o tipo dicotômico. Este é um tipo
de variável que apresenta, apenas, duas categorias. Pode ser nominal ou ordinal.
Exemplos: (a) sexo masculino ou sexo feminino; (b) hipertensão arterial: presente ou
ausente.

Observe, também, que as variáveis categóricas são denominadas de variáveis


qualitativas, uma vez que elas expressam uma qualidade de interesse na área de
estudo, já que, na variável quantitativa, os valores têm significado numérico.

As variáveis do tipo categórica ordinal também chamada de variável categórica (ou


qualitativa) por postos, ou seja, quando os elementos forem reunidos, segundo a
ordem em que aparecem dispostos numa lista. Exemplo: lista classificatória de um
concurso público.

Unidade de Observação

É o elemento que o investigador toma por base em sua pesquisa.

UPE - Universidade de Pernambuco


Exemplos:
a) pessoas selecionadas para estudos;
b) fragmento de pele encaminhado para análise laboratorial;
c) peixe selecionado num rio para estudo.

Amostragem aleatória

Seleção de uma amostra na qual cada membro do conjunto selecionado tenha a 1


mesma probabilidade de ser incluído.
15
Exemplo:

NEED - Núcleo de Estudo em Educação a Distância


Retirar uma amostra de 30% dos alunos da turma de terceira série A, do Ensino Médio
da escola X. O conjunto amostra dessa pesquisa tem como elemento o estudante de
uma específica turma, e qualquer aluno tem a possibilidade de ser escolhido. Logo,
se esta turma tem 50 estudantes, qualquer um deles pode formar o conjunto de 15
para a amostra. Todos têm a mesma possibilidade.

Experimentos aleatórios

São experimentos que podem ser repetidos em iguais condições, porém o resultado
que vai ocorrer não é um resultado esperado, com certeza.
Exemplo:
Em Recife 3% das pessoas têm a patologia Esclerose Múltipla. Selecionar mil pessoas
e verificar qual delas é portadora dessa patologia.

O que Envolve um Problema Estatístico?

Depois de compreender estes conjuntos de informações preliminares sobre


UPE - Universidade de Pernambuco

estatística, podemos agora pensar que, num estudo estatístico, estamos a


compreender uma situação-problema, ou seja, um recorte da complexidade. Sendo
assim, ao estruturar um modelo matemático (estatístico), o que envolve o problema
em estudo? Este fato fora especificado por Mendenhall, 1985, p.16. Vejamos:

-Uma clara definição dos objetivos da experiência e da população associada.


-Projeto de experiência (procedimento amostral).
-Coleta e análise de dados.
-Procedimento a ser adotado, a fim de realizar inferências acerca da população,
1 tomando como base as informações contidas na amostra.
-Provisão de uma medida da confiabilidade de uma inferência a ser realizada.
16
NEED - Núcleo de Estudo em Educação a Distância

Esses fatos podem conduzir o estudante em sua pesquisa (e estudos) de


bioestatística a otimizar seus resultados. E o primeiro passo é entender essa
formação de alicerces para compreender a matemática envolvida e construída nos
processos estatísticos.

Conclusão/Orientação ao Estudante

Prezado estudante, esse texto é o seu primeiro contato com a disciplina bioestatística
e, sendo assim, você deve desempenhar um papel importante no ato de leitura e
compreensão. Para tal, vamos esboçar para você alguns passos que você deve
exercitar nessa sua leitura e compreensão do texto. Vejamos:

PRIMEIRO: Você deve fazer uma leitura geral de todo o texto sem a preocupação
de compreendê-lo como um todo.
Esses passos não formam uma receita de bolo, você deve descobrir o seu próprio
método (ou métodos) de aprendizagem. Se já possui, exercite-o (ou exercite-os).
Mas um fato interessante é que você, além de estar compreendendo a disciplina, está
também se profissionalizando na área de educação. Por isso, a necessidade de
compreensão de suas disciplinas no curso, inclusive da bioestatística, serão de suma
importância para o exercício de sua profissão, em que o conhecimento e a
aprendizagem que você tem da disciplina, em sua atuação como professor(a), deve
ser, em princípio, uma habilidade.

UPE - Universidade de Pernambuco


Exercício 1.4

Esse é o seu espaço de re-leitura do texto e de um exercício sobre a disciplina nesse


primeiro momento, após você ter resolvido os exercícios anteriores e lido (no sentido
de compreender) todo o material. Este último exercício é para uma verificação da
aprendizagem na rede, e você deve consultar a agenda da disciplina na plataforma
para entrega do mesmo.

PRIMEIRA: De que maneira a Estatística ajuda a resolver certos problemas 1


práticos? Justifique sua resposta com um exemplo.
17
SEGUNDA: Suponha que você seja chamado para prever a média das notas dos

NEED - Núcleo de Estudo em Educação a Distância


alunos de Ensino Médio, de sua escola, na primeira série, na disciplina de biologia.
Que variáveis você julgar ser necessárias? Justifique-as.

TERCEIRA: Uma indústria, produtora de equipamentos eletrônicos produz


algumas unidades que não funcionam corretamente. O que você pode levantar
suposições sobre essa produção? É possível eliminar o erro totalmente?

QUARTA: Suponha que você queira obter uma estimativa do consumo de


gasolina (km por litro) do carro de marca X. Descreva a população que interessa neste
caso, a partir da qual você poderá selecionar uma amostra.

QUINTA: Você é candidato ao Legislativo de seu estado e deseja examinar as


preferências dos eleitores com relação às suas chances de sair vitorioso. Identifique,
então, a população que lhe interessa, a partir da qual você poderá obter a amostra
desejada. De que maneira essa população irá depender do tempo?

SEXATA: Uma pesquisa médica visa obter uma estimativa do tempo de vida de
um paciente, após este ter sido ser acometido de um tipo específico de câncer e após
ser submetido a um regime particular de radioterapia. Identifique a população que
interessa. É possível perceber algum problema para essa amostrar essa população?
UPE - Universidade de Pernambuco

Leituras Recomendadas

Nesse primeiro momento, o interessante é que você dedique-se a esse texto. Poderá
consultar texto na Internet (ver os sites indicados na orientação do aluno item
quinto). E junto a isso, proceda a uma leitura no capítulo primeiro do livro [5] na
referência bibliográfica deste texto.

Prática Realizadar e Discutir no Transcorrer


1 desta Aula (Optativo)

18 Tome uma moeda, de dez centavos, por exemplo, coloque-a sobre uma mesa de sua
casa. E responda a seguinte questão? Quando eu empurrar esta moeda até ao chão,
NEED - Núcleo de Estudo em Educação a Distância

na vigésima vez ela dará cara? (repita o experimento sempre da mesma maneira).
Anote cada resultado que você encontrar, desde a primeira até a vigésima vez que
você empurrou a moeda para o chão. Responda agora: o número de caras que você
obteve foi igual ao número de caras? E o seu resultado esperado coincidiu?

Após esta prática você deverá perceber que o resultado esperado, de ½ para a cara ou
coroa só começa aparecer quando temos uma enorme quantidade de dados relativos
a estes resultados. Este fato deve ser compartilhado com outros colegas de outros
pólos diferentes do seu para agrupar mais dados e observar a possibilidade desse
resultado com mais realidade. Isto vai ser útil a você na compreensão do conceito de
probabilidade.
Referência Bibliográfica

Bibliografia Comentada

[1] BIEMBENGUT, Maria Salett & HEIN, Nelson. Modelagem Matemática


no Ensino. São Paulo, SP; Contexto, 2000, 127p.
Este é um livro dedicado à Educação Matemática e nele há a pretensão de
esclarecer o que é o modelo e modelagem matemática, como utilizar a
essência da modelagem no ensino e na aprendizagem. Fora introduzido
nessa referência como um referencial para a modelagem em estatística.
Sua linguagem muito é adaptada e bem dirigida ao leitor. Se houver
interesse por parte do estudante do curso de biologia, sobre este livro,
ele deve consultar a parte 1, que compreende da página 1 até 30.

[2] BRASIL, Ministério da Educação, Secretaria de Educação Média e


Tecnológica. PCN+ Ensino Médio: Orientações Educacionais
complementares aos Parâmetros Curriculares Nacionais. Ciências da
Natureza, matemática e suas tecnologias. Brasília: MEC; SEMTEC, 2002. 144p.
Esta é uma edição pedagógica lançada pelo MEC como um parâmetro para o Ensino,
aqui dirigido ao Ensino Médio. E o objetivo deste material, dito no próprio
documento, é o de chegar mais perto da construção de um currículo. Nesse sentido
este documento é bom para você que está iniciando a profissionalização na área de
educação, para ler, pelo menos, a parte que se relaciona à Biologia (p. 33 58). Porém,
neste curso ele não relevância para sua aprendizagem direta, na disciplina
bioestatística.

[3] D'AMBROSIO, Ubiratan. Etnomatemática. 4ª Edição. São Paulo, SP; Ática, 1998,
88p.
Este livro está dedicado ao contexto cultural, e portanto, isso nos reporta às
linguagens. Embora esse contexto seja muito amplo, o autor tomou o livro como uma
necessidade de se repensar o ensino da matemática. Ou seja, a produção
cultural/científica da matemática é um produto social e, conseqüentemente,
histórico. Esses fatos conduzem a uma análise crítica da geração e produção do
conhecimento, da sua institucionalização e da sua transmissão. Para você enquanto
estudante de um curso de profissionalização na área de educação, fazemos saber que
uma leitura no capítulo 5, deste livro, interessa a você. O uso dessa referência neste
texto fora apenas para dar uma visão sobre a origem do termo matemática.

[4] HAZZAN, Samuel. Fundamentos de Matemática Elementar. 6ª Edição. Vol. 5. São


Paulo, SP; Atual, 1996, 174p.
Este é um livro voltado para a disciplina matemática, apresentando uma estrutura
seqüencial dos temas Combinatória e probabilidade. Constitui-se uma base
matemática para os estudantes do curso de licenciatura em biologia, quanto a esta
disciplina, em temas posteriores.

[5] HOSPITAL SÃO RAFAEL, Centro Virtual de Epidemiologia Clínica. Diretoria


Científica. Salvador, BA. Disponível em http://www.hsr.com.br/bio02.html, acesso
em 19/08/2004.
Este texto encontra-se na internet, sendo interessante para o estudante se familiarizar
com os termos da bioestatística, sob o ponto de vista da Bioestatística Clínica. É um
texto conciso e de relevância para o estudante do curso de licenciatura em biologia.

[6] MENDENHALL, William. Probabilidade e Estatística. (Trad.: José Fabiano da


Rocha; Introduction to Probability and Statistics); Vol. 1. Rio de Janeiro, RJ, Campus,
1985, 325p.
É um livro de estatística seqüencial sob o tema, mas apresenta o capítulo 1, como
sendo muito bom para o estudante, nesse momento.

[7] MILONE, Giuseppe & ANGELINI, Flávio. Estatística Geral. Vol. I. São Paulo, SP;
Atlas, 1983, 206p.
É um livro antigo, contendo um capítulo sobre a história da estatística que se destaca
como importante, no momento. Deve ser consultado, se houver interesse e tempo
do aluno, sobre este capítulo. Não é de relevância para os objetivos do curso e desse
texto.

[8] MORIN, Edgar; CIURANA, Emílio-Roger & MOTTA, Raúl. Educar na Era
Planetária: o pensamento complexo como método de aprendizagem no erro e na
incerteza humana. (Tradução de Sandra Trabucco). São Paulo, SP; Cortez, Brasília,
DF: UNESCO, 2003, 111p.
Este é um livro que você deve ter em sua biblioteca pessoal, não somente para esse
momento, mas para você começar a pensar a Educação Científica. Sua citação nesse
texto fora para mostrar a diferença entre complexo e complexidade, muito bem
exposto pelos autores.

[9] NÖRT, W. Panorama da Semiótica: de Platão a Pierce. São Paulo, SP: Annablume,
1995, Coleção E, 159p.
Este livro oferece ao leitor uma oportunidade ímpar, de compreender o significado da
semiótica para uma formação científica. Deve ser ele, numa oportunidade futura uma
leitura importante para o estudante em formação de licenciatura.

[10] PAIS, Luiz Carlos. Didática da Matemática: uma análise da influência francesa.
Belo Horizonte, BH; Autêntica, 2001, 125p.
A introdução desse livro na bibliografia teve o objetivo de fazer uma distinção entre
conhecimento e saberes, pois em educação faz-se necessário conhecer essa
diferença para uma melhor performance de sua atuação como professor(a). Se
houver interesse de o estudante querer conhecer sobre: transposição didática;
criações didáticas; epistemologia do professor; obstáculos epistemológicos e
didáticos; os conceitos e as definições; complexidade do conceito e engenharia
didática. Este livro é um bom referencial para sua formação profissional, embora
esteja formatado para a disciplina matemática.
[11] PERRENOUD, P. et. al. As competências para Ensinar no Século XXI: A formação
dos profissionais e o desafio da avaliação. Rio Grande do Sul, RS, Porto Alegre:
ARTMED, 2002, 176p.
Este livro é indicado para o profissional da educação, e apresenta as ênfases de um
trabalho na escola do século XXI. Deve ser lido numa oportunidade futura pelos
estudantes de licenciatura.

[12] STEVENSON, William. Estatística Aplicada à Administração. Tradução: Alfredo


Alves de Farias; Business Statistics). São Paulo, SP. HARBRA, 1981, 495p.
Este é um livro específico de estatística, voltado para à administração, porém pode
ser consultado pelo estudante de biologia sobre alguns conceitos matemáticos.

[13] ZAR, Jerrold H. Biostatistical Analysis. 4ª Edição. USA, Pretece-Hill, 1999, 663p.
Este é um livro específico para a bioestatística, muito bem estruturado, embora
seqüencial, mas com o diferencial de que está escrito na língua inglesa. Mas, se o
estudante ler em inglês, este livro é uma referência para todo o seu curso de
bioestatística.
Introdução à Bioestatística FASCÍCULO

Carga Horária 10 horas


Gilberto Pereira da Silva
Mário de Souza 2
Objetivos

-Compreender o gráfico como uma forma de linguagem matemática


necessária ao estudo estatístico;

-Entender o gráfico como uma das formas de melhor visualizar os dados


construídos e tabelados numa pesquisa;
-Conhecer como se desenvolve a construção desses gráficos dentro de uma análise
matemática de sua construção.

Introdução

Muitas das investigações sistêmicas no processo do conhecimento científico, ou


seja, na formação de saberes, aqui em relevo, a biologia, há necessidade de levantar
dados numéricos. Esse fato traz consigo, muitas das vezes, a premissa da construção
UPE - Universidade de Pernambuco

de gráficos a partir dos dados coletados. Nesse momento, temos dois fatos
interessantes: primeiro, o processo de contagem desses dados coletados e, segundo,
o gráfico a ser construído.

Esses dois fatos vêm da característica ímpar da estatística que busca a análise e a
interpretação dos dados como forma de viabilizar uma possibilidade de conclusão
baseada nas coletas de dados junto à análise gráfica, ou seja, numa linguagem visual.
Isso advém do processo das investigações sistêmicas que, organizadas desse modo,
têm a vantagem de apresentar um maior número de informações que podem ser
2 retiradas (compreendidas) de dentro do contexto da tabulação e/ou do gráfico, ou
seja, no contexto da análise estatística.
24
Sendo assim, há uma necessidade de compreender como se constroem as
NEED - Núcleo de Estudo em Educação a Distância

tabulações como também os processos de construções de gráfico, bem como os


seus tipos e suas possibilidades de viabilizar informações visuais, buscados no
processo de coletagem de dados previamente tabulados. Aqui vale salientar que o
termo informações está atrelado à capacidade de leitura do gráfico ou tabela que está
à disposição para a análise.

Nesse espectro, temos que compreender que o processo analítico inclui a análise de
informação qualitativa e quantitativa, na qual, essas informações estão contidas nos
tipos de variáveis, já estudadas no fascículo anterior. Isso caracteriza a idealização de
informação, para este estudo, repito, como uma capacidade de leitura e
interpretação que se faz diante do gráfico ou da tabela em processo de análise.

Assim sendo, a informação qualitativa está, do mesmo modo que as variáveis,


dividida em duas categorias.
[a] nominal, na qual os atributos, em princípio não têm uma relação bem definida
entre eles. Por exemplo: tipo sangüíneo e classificação da cor da pele são
informações nominais que podem ser obtidas numa pesquisa, porém não existe
nenhuma relação entre esses dois atributos, ou seja, uma relação ou função bem
definida entre o tipo sangüíneo e a cor da pele.
[b] ordinal, na qual os atributos possuem uma ordem (crescente ou decrescente) ou
um julgamento de: grande/médio/grande; leve/moderado/grave, entre outros. Por
exemplo, uma pessoa X tem uma hipertensão moderada, enquanto que a pessoa Y
tem uma hipertensão grave. Logo, esses são atributos que têm uma ordem, embora

UPE - Universidade de Pernambuco


não quantificada, por isso estão na categoria qualitativa.

Enquanto que a informação quantitativa está seguindo a mesma trilogia, também,


dividida em duas categorias.

[a] discreta, na qual os atributos não estão numa ordem, mas dentro de uma faixa de
valores encontrados discretamente. Exemplo, o número de bactéria x em um volume
de urina, encontrada numa pessoa, nos meses de março, maio e julho, após esta
pessoa ter sido infectada no mês de março, e submetida a um tratamento. Esses são
dados discretos obtidos para cada um dos meses, após ter sido detectada a referida
2
bactéria.
25
[b] contínua, na qual os atributos podem estar dentro de uma faixa contínua de

NEED - Núcleo de Estudo em Educação a Distância


valores. Por exemplo, a altura de um grupo de mil jovens entre 15 e 18 anos, de várias
regiões do Brasil, que foram escolhidos aleatoriamente.

O fato interessante é que, nessa última informação, é que iremos nos deter,
considerando o carro chefe no processo de criação de tabelas e gráficos, pois são
dados quantitativos. Por isso, entende-se como informação quantitativa os atributos
quantificados e dispostos num intervalo numérico.

Um fator observável na construção de dados com intervalos numéricos a serem


plotados (desenhados) é a questão do Zero. Pois, na construção de gráficos existe a
necessidade de compreendermos o Zero, aqui entendido como a origem do sistema
de coordenadas, em que se está trabalhando. Isso se faz necessário, pois, às vezes,
esse ponto é arbitrário. Esse fato dá uma certa “liberdade” para quem constrói gráfico
com esta possibilidade.
Exemplos:

[a] Suponha que queremos plotar o gráfico dos diâmetros de um conjunto de árvore
de um parque de preservação florestal, com mais de dez anos de existência. Temos
aqui o limite de área, que é o tamanho do parque. A definição do conjunto, que são as
árvores. E a amostra, que é composta por árvores desse parque, com um mínimo de
dez anos. Feita a catalogação desses diâmetros, vamos plotar o gráfico com a
quantidade de árvores com diâmetros nas faixas F1, F2, F3 e F4 (determinado após as
pesquisas, segundo um critério matemático). Nesse caso, poderíamos tomar, por
exemplo, diâmetros entre 0 e 20cm, como sendo a F1. Neste caso, o “zero” está
UPE - Universidade de Pernambuco

inserido numa faixa, e não é um ponto.

[b] Suponha agora que queremos plotar o gráfico das temperaturas médias
encontradas em cinco pontos distintos de um parque de preservação florestal, a
partir das seis horas da manhã até as dezoito horas de um mesmo dia, durante uma
semana de cada mês. Aqui, vê-se que não vamos encontrar a temperatura de zero
graus, logo, ao traçar o gráfico da semana de cada mês versos a temperatura, não
teremos o ponto zero no gráfico, apesar de poder colocá-lo como referência. Embora
esta referência seja útil para dimensionarmos o eixo das abscissas (ou o eixo x, no
2 sistema de coordenada cartesiana).

26 Exercício 2.1
NEED - Núcleo de Estudo em Educação a Distância

Classifique as grandezas abaixo em: nominal; ordinal; discreta e contínua.

Descrição Nominal Ordinal Discreta Contínua


Sexo do grupo de adolescente de uma escola
Grupo de fumantes ou não fumantes
Número atendido de ataques de angina
Pressão arterial do conjunto de funcionário
Peso de cada elemento de um grupo escolar
Tipo de parto (normal/cesária)
Número de praia poluída no NE do Brasil
Nível de colesterol sérico (mg/100cc)
Condição de saúde (doente / não doente)
Número de filhos de ca da família em Recife
Esse é o primeiro passo dado que busca compreender a construção de tabelas de
contagem e a construção de gráficos. Para tal, um elemento que se destaca é a
Apuração de Dados. Vejamos o que isto significa.

Apuração de Dados

É o processo pelo qual conta-se o número de vezes em que a variável assumiu um


determinado valor.

UPE - Universidade de Pernambuco


Exemplo:

Número de filhos de cada família da Rua X, do Bairro Y, da cidade do Recife, em


PE/Brasil.

Logo, para resolver esse problema, ou seja, para levantar dados, precisamos apurá-
los, definindo primeiro quem é a variável. Nesse caso, vamos chamar de X essa
variável, que, pela natureza do problema, é o indivíduo: família. Assim sendo, temos: 2

X: número de filhos de cada família


27

NEED - Núcleo de Estudo em Educação a Distância


Agora, cada família possui um certo número de filhos por decisão interna desta. Cabe
ao estatístico, apenas, levantar a apuração desses dados para, depois, um conjunto
de especialista (da área social, por exemplo), faça uma análise dos dados
encontrados. Agora temos que apurar o número de elementos (filhos) de cada
família, ou seja, cada família agora terá assumido um valor.

Vamos supor que nesse espaço de reserva para a pesquisa, ou seja, rua X, bairro Y, da
cidade do Recife, existam 20 (vinte) casas. E do levantamento observou-se que, se
associarmos cada casa como sendo uma família, temos:
CASA NÚMERO DE FILHOS CASA NÚMERO DE FILHOS
01 2 11 4
02 4 12 1
03 0 13 2
04 0 14 2
05 1 15 6
06 5 16 3
07 3 17 2
08 2 18 2
09 9 19 1
10 1 20 3
UPE - Universidade de Pernambuco

Numa rápida análise desses dados, percebemos que o maior número de filhos se
encontra na casa 15, que é de seis filhos, e o menor número de filhos encontrados,
fora de zero. Assim, num primeiro momento, podemos dizer que o número de filhos
dessa amostra, varia de zero até seis.

E temos que:

[a] famílias com 0 filho estão nas casas: 03, 04.


2 [b] famílias com 1 filho estão nas casas: 05, 10, 12, 19.
[c] famílias com 2 filhos estão nas casas: 01, 08, 13, 14, 17, 18.
[d] famílias com 3 filhos estão nas casas: 07, 16, 20.
28 [e] famílias com 4 filhos estão nas casas: 02, 11.
[f] famílias com 5 filhos estão nas casas: 06, 09.
NEED - Núcleo de Estudo em Educação a Distância

[g] famílias com 6 filhos está na casa: 15.

Ou seja:

X número de filhos de cada família (variável).


Xi número de famílias (indivíduo).

Onde podemos tabular:

Número de filhos - X 0 1 2 3 4 5 6
Número de famílias - xi 2 4 6 3 2 2 1
Dizemos, então, que
[a] a variável 0 filho assume valor 2, ou seja, duas famílias.
[b] a variável 1 filho assume valor 4, ou seja, quatro famílias.
[c] a variável 2 filhos assume valor 6, ou seja, seis famílias.
[d] a variável 3 filhos assume valor 3, ou seja, três famílias.
[e] a variável 4 filhos assume valor 2, ou seja duas famílias.
[f] a variável 5 filhos assume valor 2, ou seja, duas famílias.

UPE - Universidade de Pernambuco


[g] a variável 6 filhos assume valor 1, ou seja, apenas uma família.

Os valores assumidos por cada variável recebem o nome de freqüência de


ocorrência, sendo representados pela letra f. Assim, numa tabulação estatística, a
forma de apresentar esses dados pode ser da seguinte maneira:

TABELA – 01

APURAÇÃO DOS DADOS


Número de filhos - n Freqüência de ocorrência - f 2
0 2
1 4
2 6
29
3 3

NEED - Núcleo de Estudo em Educação a Distância


4 2
5 2
6 1
TOTAL
20

Essa forma de apresentar dados é mais lucrativa em termos de sistematização de


informação, pois, numa olhada (informação visual), podemos obter informações
mais concisas a respeito dessas famílias.

Observe, também, que o número de filhos pode ser calculado com um olhar sobre a
tabela acima, ou seja, basta multiplicar o número de filhos por cada freqüência de
ocorrência e, depois, somar, assim sendo:
Nº de filhos = 0x2 + 1x4 + 2x6 + 3x3 + 4x2 + 5x2 + 6x1 = 0 + 4 + 12 + 9 + 8 + 10
+ 6 = 49

Um outro dado que pode ser obtido desta tabela é o percentual da freqüência de
ocorrência, ou seja, as freqüências relativas, que será representada por fr. Onde:

Freqüência relativa é a razão entre o número de ocorrência de uma certa variável pelo
total das freqüências de ocorrência, ou seja:
UPE - Universidade de Pernambuco

fi
fr ?
? i
fi

onde o ∑
f é o total da soma de todas as freqüências de ocorrência
i
i

Assim, para o primeiro caso, em que o número de filhos é zero temos:

2
2 fr =
20
=
0,1

30 Desse modo, a tabela 01 pode ser refeita e colocada na forma:


NEED - Núcleo de Estudo em Educação a Distância

TABELA – 02

APURAÇÃO DE DADOS
n fi n x fi fr
0 2 0 2/20 = 0,10
1 4 4 4/20 = 0,20
2 6 12 6/20 = 0,30
3 3 9 3/20 = 0,15
4 2 8 2/20 = 0,10
5 2 10 2/20 = 0,10
6 1 6 1/20 = 0,05
TOTAL 20 49 20/20 = 1
Observe que esta tabela pode ser ainda acrescida de uma informação em percentual
para os dados obtidos da freqüência relativa. Assim:

TABELA – 03

APURAÇÃO DE DADOS
n fi n x fi fr %
0 2 0 2/20 = 0,10 10
1 4 4 4/20 = 0,20 20

UPE - Universidade de Pernambuco


2 6 12 6/20 = 0,30 30
3 3 9 3/20 = 0,15 15
4 2 8 2/20 = 0,10 10
5 2 10 2/20 = 0,10 10
6 1 6 1/20 = 0,05 5
TOTAL 20 49 20/20 = 1 100

Agora, podemos perceber que, o maior percentual está ligado às famílias que
possuem dois filhos (30%), seguindo-se das famílias que possuem um filho (20%), ou
seja, metade das famílias dessa rua têm um ou dois filhos.

2
Exercícios 2.2
31
01 - Em uma pesquisa realizada com 200 pessoas, pergunta-se. Qual o seu estado

NEED - Núcleo de Estudo em Educação a Distância


civil? As respostas foram: [a] solteiro: 70; [b] separado: 30; [c] casado: 80 e [d] viúvo:
20. Construa a tabela:

APURAÇÃO DE DADOS
Estado civil - Freqüência de Freqüência Porcentagem
n ocorrência - fi relativa - fr %

TOTAL
02 - Em uma pesquisa socioeconômica sobre itens de conforto, perguntamos a
800 entrevistados: quantos aparelhos de televisão em cores há em sua casa? Os
resultados aparecem na tabela abaixo: (complete a tabela).

APURAÇÃO DE DADOS
Número de Freqüência de Freqüência Porcentagem
aparelhos n ocorrência - fi relativa - fr %
0 20
UPE - Universidade de Pernambuco

1
2
3 0,6
4 7,5
5 30
TOTAL

Observação 01:
Todas essa tabelas até agora estudadas são as ditas tabelas unidimensionais, ou seja,
2 trabalha-se com uma variável. Caso estejamos a trabalhar com duas variáveis, por
exemplo, dizemos que ela é do tipo tabelas bidimensionais. Vejamos um exemplo de
32 uma tabela bidimensional:
NEED - Núcleo de Estudo em Educação a Distância

Distribuição de pacientes, segundo ronco noturno e doença cardíaca

DOENÇA CARDÍACA TOTAL


RONCO NOTUR NO Sim Não
n % n % n %
Não 24 1,7 1355 98,3 1379 100
Ocasional 35 5,5 603 94,5 638 100
Quase sempre as noites 21 9,9 192 90,1 213 100
Sempre 30 11,8 224 88,2 254 100
TOTAL 110 4,4 2374 95,6 2484 100
Fonte: Hand DJ et al. A handbook of small data sets. Chapman & Hall, 1994.
Com esta informação adicional, os dados a seguir são relativos ao peso ao nascer (em
gramas) de recém-nascidos com síndrome de desconforto idiopático grave. Algumas
crianças foram a óbito (*), e outras sobreviveram.

Com esta informação adicional, os dados a seguir são relativos ao peso ao nascer (em
gramas) de recém -nascidos com síndrome de desconforto idiopático grave. Algumas
crianças foram a óbito (*), e outras sobreviveram.

1030* 1300* 1720 2090 2570

UPE - Universidade de Pernambuco


1050* 1310* 1750 2200* 2600
1100* 1410 1760 2200 2700
1130 1500* 1770* 2270* 2730*
1175* 1550* 1820 2275 2830
1185* 1575 1890* 2400 2950
1225* 1600* 1930 2440 3005
1230* 1680 1940* 2500 3160
1262* 1715 2015 2550 3400
1295* 1720* 2040 2560 3640
Fonte: Hand DJ et al. A Handbook of small data sets. Chapman & Hall, 1994

03 - Apresente as variáveis em tabelas unidimensionais, classificando-as em: [a] 2


abaixo do peso (menos que 2500g) e [b] não abaixo do peso (maior ou igual a 2500g).
33
04 - Faça uma tabela bidimensional, cruzando as variáveis: [a] condição do recém-

NEED - Núcleo de Estudo em Educação a Distância


nascido (sobrevivente ou não sobrevivente) e [b] peso ao nascer (baixo peso e não
baixo peso).

05 - Interprete o resultado obtido na questão anterior, ou seja, imagine-se como


um especialista na área de saúde que irá informar estes resultados a um outro colega
especialista de um outro hospital.

Observação 02:
-Ao usarmos nas tabelas o nome freqüência de ocorrência, faz-se necessário saber
que, muitas vezes, nessa coluna, aparece simplesmente o nome freqüência ou
freqüência absoluta. Que agora pode ser representada apenas por f, e não há
necessidade de apresentarmos como fi como vínhamos fazendo, fato que simplifica
a tabela embora o significado seja o mesmo.
-Um outro caso de estudo das freqüências na construção das tabelas, para uma
posterior construção de gráficos, é a chamada freqüência acumulada. Esse tipo de
freqüência pode incidir sobre as freqüências absolutas e sobre as freqüências
relativas. Como o próprio nome sugere, a freqüência acumulada é a soma (acúmulo)
das freqüências absolutas ou relativas de dois ou mais subconjuntos de dados.

Para melhor entendermos esse processo, vamos calcular as freqüências acumuladas


absolutas faa e as freqüências acumuladas relativas far, partindo-se da tabela 03.
UPE - Universidade de Pernambuco

TABELA – 04

APURAÇÃO DE DADOS
n f faa fr far nxf %
0 2 2 0,10 0,10 0 10
1 4 6 0,20 0,30 4 20
2 6 12 0,30 0,60 12 30
3 3 15 0,15 0,75 9 15
4 2 17 0,10 0,85 8 10
5 2 19 0,10 0,95 10 10
2 6 1 20 0,05 1 6 2
TOTAL 20 1 49 100
34
NEED - Núcleo de Estudo em Educação a Distância

Isso apresenta uma grande vantagem para a leitura da tabela, pois, num olhar sobre
ela pode-se perceber que famílias com números de filhos menores que dois (2, 1 ou
0) são maioria, ou seja, são 12 (ver faa) dentre as 20 famílias, fato que corresponde a
0,60 (60%) do total (veja que temos um acúmulo de 10 + 20 + 30 = 60).

Vale salientar que na construção da tabela 04, usamos o fato de termos faa e far
como crescente, embora nada impeça que possamos usá-la como decrescente,
conforme mostra a tabela na outra página.
TABELA – 05

APURAÇÃO DE DADOS
n f faa fr far nxf %
0 2 20 0,10 1 0 10
1 4 18 0,20 0,9 4 20
2 6 14 0,30 0,7 12 30
3 3 8 0,15 0,4 9 15
4 2 5 0,10 0,25 8 10
5 2 3 0,10 0,15 10 10

UPE - Universidade de Pernambuco


6 1 1 0,05 0,05 6 2
TOTAL 20 1 49 100

Exercício 2.3

Construa duas tabelas em que apareçam (acrescentadas) as faa e as far, do exercício


01, conforme modelo das tabelas 04 e 05, apresentado anteriormente.

Diagrama de Pareto 2
35
Uma forma de complementar esse dados tabulados é expressá-los através de

NEED - Núcleo de Estudo em Educação a Distância


gráficos. Essa componente nos estudos estatísticos se faz sempre presente, quando
queremos dar uma representação gráfica ou visual daquilo que estamos a estudar.
Essa forma de apresentação tem a vantagem de mostrar de forma instantânea um
visual que será analisado diante dos problemas que se persegue, com a possibilidade
de apresentar uma maior compreensão para compreensão do que se estuda e que
está em análise. Isso representa formas mais dinâmicas, expressivas e globais de se
estudar um problema estatístico.

Para se analisar o comportamento gráfico, vamos começar a compreender o que vem


a ser o diagrama de Pareto, e, para tal, vamos verificar o significado desse nome. “No
final do século passado, um economista italiano de nome Pareto estudou a
distribuição de renda e verificou que poucas pessoas detinham a maior parte da
renda, enquanto muitas pessoas tinham, apenas, uma pequena porção da renda. [...]
Em homenagem ao economista que primeiro discutiu esse tipo de distribuição,
denominou-se a figura de “diagrama de Pareto”” (VIEIRA, 1999, p. 13).
O estudo dos gráficos teve também uma outra personagem importante em seus
estudos a enfermeira Florence Nightingale (1820 1910) que, em 1907, recebera das
mãos do rei Eduardo VII a ordem do mérito. Ela “foi uma das pioneiras na utilização
dos gráficos estatísticos. Nasceu na Villa Colômbia, próxima de Florença, na Itália,
em maio de 1820 e morrera em agosto de 1910, na cidade de Londres, com 90 anos.
Florense Nightingale utilizou-se dos dados estatísticos, quer em formas de tabelas,
quer em formas de gráficos, como ferramenta para suas atividades de reforma na
área de saúde... seus gráficos foram tão criativos que se constituíram num marco do
desenvolvimento da Estatística...ela foi a primeira mulher eleita membro da
UPE - Universidade de Pernambuco

Associação Inglesa de Estatística” (IEZZI, et al. 2004, pp. 170-171).

Hoje a importância dos gráficos nos estudos da Estatística e sua difusão nos meios
sociais com informações para todo um público demonstram a validade de seus
estudos e sua possível praticidade diante dos olhos do outro, ou seja, daquele que se
dispões a lê-los e a interpretá-los, segundo o vislumbre das informações contidas na
comunicação visual e dos interesses que esses elementos estatísticos (tabelas e
gráficos) apresentam para quem os lê.

2 E, para começar a estudá-los, vamos traçar o diagrama de Pareto para os dados da


tabela 04, fazendo, em seguida, uma indicação de como todo o processo é
36 constituído. É preciso entender que a construção do diagrama de Pareto parte do
princípio de que os dados já construídos num processo de elaboração as tabelas já
NEED - Núcleo de Estudo em Educação a Distância

estejam concluídos. E, para desenhar o diagrama de Pareto, devemos, segundo Vieira


(1999, p. 15), adotar os seguintes passos:

[a] trace um eixo horizontal e divida esse eixo em tantas partes iguais quantas são as
categorias listadas na tabelas;

[b] trace um eixo vertical e escreva nele as freqüências;

[c] trace barras verticais, com base no eixo horizontal e altura igual à freqüência da
categoria. A figura resultante é o diagrama de Pareto;

[d] complete a figura, colocando título, unidades, datas e nome do responsável pela
coleta de dados.
Para termos uma idéia desse processo, elabora-se o Diagrama de Pareto para os
dados da Tabela 02. Vejamos o gráfico:

UPE - Universidade de Pernambuco


Um outro diagrama importante também é a chamada curva de Pareto que tem
origem no gráfico anterior e faz uso da freqüência absoluta acumulada ou da
freqüência acumulada relativa.

Observe na tabela 04 que, para o caso inicial de zero filho, temos 0,20 (20%) para os
dois caso juntos, ou seja, zero e um filho temos 0,30 (0,10 + 0,20), ou seja, 30%. E,
assim por diante, conforme a citada tabela, que termina em 1 (100%).
2
37
Vejamos esta construção. Primeiro: elabora-se o gráfico conforme o anterior, com

NEED - Núcleo de Estudo em Educação a Distância


um detalhe a mais, que é o fato da parte superior ser maior para tomar os dados
referentes à far. Segundo: do lado esquerdo do gráfico, estão os dados referentes ao
número de filhos, logo, do lado direito, encontrar-se-ão as informações relativas as
far. Terceiro: em cada lado direito de cada coluna que referenda o número de filhos,
marca-se o ponto referente a far. Quarto: liga-se cada ponto encontrado no lado
direito de cada coluna, formando o que se chama de curva de Pareto. Observe que
escolhemos a far, e em nada mudaria (em passos de construção dessa curva), se
tivéssemos tomado a faa.

Como o referido gráfico vai de 0 (zero) até 7 (sete), na abscissa, enquanto a far vai de
0,10 até 1,00, na ordenada. Por esse motivo, vamos colocar o gráfico com dez
divisões na ordenada significando cada parte correspondente a 0,10 ou 10%.
UPE - Universidade de Pernambuco

Desse modo, observe que a referida construção segue os mesmos passos para o caso
da far decrescente (o gráfico acima se refere a far crescente).

Exercício 2.4

2 Preencha a tabela abaixo e, em seguida, construa o diagrama de Pareto para os tipos


de defeitos. Depois faça a curva de Pareto para, também os tipos de defeitos.
38
NEED - Núcleo de Estudo em Educação a Distância

Distribuição de peças, segundo o tipo de defeito

Tipo de Freqüência Freqüência Freqüência Freqüência


defeito absoluta absoluta relativa acumulada
acumulada relativa
Saliências 19
Asperezas 18
Riscos 12
Manchas 10
Cor 10
Outros 11
Total 80

Um outro tipo de gráfico usado em dados estatísticos é o denominado Gráfico de


Barras. Geralmente é usado para representar variáveis qualitativas ou ordinais. Sua
construção é parecida com o gráfico de colunas, primeiramente, construindo-se o
sistema de eixos cartesianos; segundo, no eixo das abscissas (ou das ordenadas),
colocam-se as categorias da variável que está se estudando ou analisando.
Finalizando, constroem-se as barras com comprimento equivalente à freqüência
absoluta ou freqüência relativa.

Exemplo:
Na tabela abaixo, apresenta-se o número de internações em estabelecimentos de
saúde, por espécie de clínica, no ano de 1992. Veja o gráfico de barras desses dados
logo abaixo.

UPE - Universidade de Pernambuco


Espécie de clínica Freqüência absoluta Freqüência relativa
Médica 6.457.923 32,51%
Ginecológica e Obstetrícia 3.918.308 19,73%
Cirurgia 3.031.075 15,26%
Pediatria 2.943.939 14,82%
Outras 3.513.186 17,69%
Fonte: IBGE, Diretoria de Pesquisa, Pesquisa de Assistência Médico – Sanitária.

2
39

NEED - Núcleo de Estudo em Educação a Distância

Gráfico de Setores

Também usado para representar variáveis qualitativas ou ordinais. “Para fazer um


gráfico de setores, primeiro se traça uma circunferência que, como se sabe, tem
360º. Essa circunferência representa o total, ou seja, 100%. Dentro dessa
circunferência, devem ser representadas as categorias da variável em estudo. Para
isso, toma-se a freqüência relativa de cada categoria e calcula-se o ângulo central da
seguinte maneira: se 100% correspondem a 360º, uma categoria com freqüência
relativa fr terá um ângulo central x, tal que (VIEIRA, 1980, 20)”.
100 360º
fr x

logo:

360 f
x?r
100
UPE - Universidade de Pernambuco

Exercício 2.5

Tomar o exercício anterior o qual está se referindo ao número de internações em


estabelecimento de saúde, por espécie de clínica, em 1992, a fim de elaborar o
gráfico de setores para o levantamento de dados apresentados.

Histograma

2 Uma outra forma de apresentar dados gráficos é colocá-los na forma de um


histograma (dados agrupados). Mas, antes de construirmos um histograma, vejamos
40 alguns passos que ascendem o momento de formatar o gráfico. Para isso vejamos a
tabela abaixo:
NEED - Núcleo de Estudo em Educação a Distância

3
Consumo de água, em m , de 75 contas da SABESP

32 14 22 11 34 40 16 26 23 13 31 27 10 38 17
45 25 10 18 23 35 22 30 14 18 20 13 24 35 29
33 48 20 12 31 39 17 58 19 16 12 21 15 12 20
51 12 19 15 41 21 29 25 13 23 32 14 27 43 37
28 37 26 44 11 53 38 46 17 36 28 49 56 19 11

1º Passo: Identificar o tamanho da amostra


N = 75
2º Passo: Identificar o maior valor nesse conjunto de dados
H = 58

3º Passo: Identificar o menor valor nesse conjunto de dados


L = 10

4º Passo: Calcular a Amplitude total que é a diferença entre H e L

UPE - Universidade de Pernambuco


A = H L A = 48

5º Passo: Calcular o número de intervalo de classe


k = 1 + 3,22logN
k = 1 + 3,22log75
k = 7,04 ou k > 7; k = 8
6º Passo: Calcular a Amplitude de Classe
AC = A / k
AC = 48 / 8 = 6 2
41
Ou seja:

NEED - Núcleo de Estudo em Educação a Distância


Menor valor é 10, com a AC = 6, e k = 8, logo.
1) 10 + 6 = 16
2) 16 + 6 = 22
3) 22 + 6 = 28
4) 28 + 6 = 34
5) 34 + 6 = 40
6) 40 + 6 = 46
7) 46 + 6 = 52
8) 52 + 6 = 58 (maior valor).
Veja que o número de intervalos de classe esperado, que é um valor inteiro e logo
acima de 7, ou seja, 8, casou bem com os dados obtidos. Pois, a Amplitude de Classe,
que é 6, e, partindo-se do menor valor com a soma dessa AC, chegamos ao maior
valor com uma coerência dos dados, ou seja, na prática encontraram-se os 8
intervalos de classe, antes previstos.

Veremos agora como montar os intervalos. Já sabemos que o menor valor é 10, e o
valor da Amplitude de Classe é 6, logo, a primeira classe consistirá dos dados entre
UPE - Universidade de Pernambuco

10 até 16. Ou seja, a partir do valor 10 até números próximos de 16, sem ser
necessariamente o 16. E, assim, segue durante toda a construção das outras classes.
Antes, vamos fazer a contagem dos dados contidos em cada classe, o que vai
representar a freqüência absoluta. Sendo assim, temos a tabela:

Observação:
A Amplitude total está aqui representada pela letra A, porém, ela também aparece AT
em algumas representações. O importante aqui é o estudante entender o seu
significado.
2
Classe Freqüência Freqüência
42 absoluta relativa
10 ? 16 16 21,33%
NEED - Núcleo de Estudo em Educação a Distância

16 ? 22 15 20,00%
22 ? 28 12 16,00%
28 ? 34 10 13,33%
34 ? 40 9 12,00%
40 ? 46 6 8,00%
46 ? 52 4 5,33%
52 ? 58 3 4,00%
TOTAIS 75 100%

Com estes dados, agora, passamos a construir o histograma. Para tal, desenhamos o
sistema de eixos cartesiano, no qual: no eixo das abscissas representamos os
intervalos de classes e no eixo das ordenadas, as freqüências absolutas.
UPE - Universidade de Pernambuco
Na parte superior deste gráfico, traçamos o polígono de freqüência. Para tal, basta
tomar o ponto médio de cada coluna em sua parte superior e unir cada um desses
pontos. Observe o polígono de freqüência na linha que envolve o histograma. 2

Um outro fato também importante na construção dos histogramas é colocar no lugar


43
das representações dos intervalos I1, I2, ..., I8 poderíamos colocar o valor do ponto

NEED - Núcleo de Estudo em Educação a Distância


médio de cada intervalo de classe. Onde o primeiro ponto médio seria:

10 ? 16
P1 ? ? 13
2

E sucessivamente teríamos: P2 = 19, P3 = 25, .... (façam os outros).


Poderíamos construir, também, o histograma, envolvendo as freqüências relativas
acumuladas. Isto fica como um exercício de aprendizagem.

Exercício 2.6

Dada a tabela abaixo, dos pesos de crianças nascidas vivas em quilogramas, construa
o histograma de freqüência absoluta e de freqüência relativa. E, ao representar o
histograma, registre o ponto médio de cada intervalo de classe.
Peso ao nascer de nascidos vivos em quilogramas

2,522 3,100 2,900 3,100 3,600 3,200 2,700 2,750 2,480 2,900
2,720 3,200 2,950 3,150 2,500 4,100 3,150 4,200 3,900 3,700
3,125 2,780 2,480 2,800 2,300 2,400 2,800 2,100 2,500 2,120
3,250 3,155 3,800 2,900 2,950 2,700 2,700 4,450 2,480 3,150
3,220 2,150 2,500 1,900 3,000 2,450 3,300 2,900 2,450 2,400
3,000 3,300 3,550 3,600 3,750 3,400 3,200 2,920 3,400 3,450
3,725 3,250 3,000 3,200 3,150 2,400 3,200 2,720 3,400 3,120
2,890 3,200 4,100 3,300 3,200 3,120 2,800 2,900 1,570 2,120
UPE - Universidade de Pernambuco

3,110 3,720 3,200 2,900 2,500 3,400 4,600 2,000 3,800 2,450
3,520 2,800 3,450 2,500 2,900 3,200 1,720 2,720 2,700 2,700

2
44
NEED - Núcleo de Estudo em Educação a Distância
Referência Bibliográfica

IEZZI, Gelson, et al. Fundamentos da Matemática. Vol 11. SP: Atual,


2004.
Este é um livro técnico, mas tem uma apresentação matemática do tema
Estatística, ao nível de Ensino Médio, muito bom e pode servir a você,
neste momento do curso, caso haja um desejo de conhecer mais a
Estatística Descritiva.

MILONE, G. e ANGELINI F. Estatística Geral. SP: Atlas, 1993.


Este é um livro dirigido em sua especificidade que é a Estatística. O seu
forte é uma linguagem clara dos conceitos trabalhados em Estatística.

VIEIRA, S. Introdução à Bioestatística. 3ª Ed. 12ª Tiragem. SP: Campus,


1980.
Um livro que pode ser consultado por você no referido curso.
Percentagens, Índices,
Coeficientes e Taxas FASCÍCULO

Carga Horária - 10 horas


Gilberto Pereira da Silva
Mário de Souza 3
Objetivos

- Compreender o significado de percentagem


- Entender o significado de dados relativos
- Conhecer a utilidade na construção de números-índices, coeficientes e
taxas
Introdução

Os dados estatísticos resultantes da coleta direta da fonte, sem outra manipulação se


não a contagem ou medida, são chamados dados absolutos. A leitura dos dados
absolutos é sempre enfadonha e inexpressiva; embora esses dados traduzam um
resultado exato e fiel, não tem a virtude de ressaltar de imediato as suas conclusões
numéricas. Daí o uso imprescindível que faz a estatística dos dados relativos. Dados
esses, que são resultados de comparação por quociente (razões) que se estabelecem
entre dados absolutos e tem por finalidade realçar ou facilitar as comparações entre
quantidades. Traduzem-se os dados relativos, em geral, por meio de percentagens,
UPE - Universidade de Pernambuco

índices, coeficientes e taxas.

1 - Percentagens

São razões que consistem em considerar um total qualquer igual a 100% e, através de
uma regra de três, estabelecer qualquer relação com as parcelas que compõem o
total assim:

3 Total — 100%
Parcela — x%
48 O que nos leva a:
NEED - Núcleo de Estudo em Educação a Distância

parcela
percentagem ? ?
100
total

Onde o x na regra de três está representado na equação logo a seguir pela palavra
percentagem. Isto significa que o valor de x, encontrado na regra de três, expressa um
valor na forma de percentagem (daí a multiplicação por 100% que tem o significado
de total). Por exemplo, encontrando-se x = 32 se expressa esse valor na forma de
percentagem 32%.

Exercícios 3.1

01 - Em 1995 o Banco do Brasil (BB) renegociou a dívida de R$ 7,1 bilhões dos


agricultores, que foi dividida em parcelas a serem pagas até o final de cada ano. O
valor da primeira parcela era R$ 700 milhões, mas somente metade foi pago; da
segunda parcela (totalizando R$ 1,1 bilhão) vencida em 1997 somente foi pago 26%
do devido. Em 1997 o lucro líquido do BB foi de R$ 646,4 milhões. Quantas vezes a
dívida restante dos agricultores no início de 1998 vale o lucro líquido do BB em 1997?

02 - Uma empresa agropecuária desenvolveu uma mistura, composta de fécula de


batata e farinha, para substituir a farinha de trigo comum. O preço da mistura é 10%
inferior ao da farinha de trigo comum. Uma padaria fabrica e vende 5.000 pães por
dia. Admitindo-se que o kg da farinha comum custa R$ 1,00 e que com 1kg de farinha
ou da nova mistura a padaria fabrica 50 pães, determine:

UPE - Universidade de Pernambuco


[a] a economia, em reais, obtida em um dia, se a padaria usar a mistura em vez
da farinha de trigo comum;
[b] o número inteiro máximo de quilos da nova mistura que poderiam ser
comprados com a economia obtida em um dia e, com esse número de quilos,
quantos pães a mais poderiam ser fabricados por dia.

03 - No mês de agosto, Pedro observou que o valor da sua conta de energia elétrica
foi de 50% superior ao valor da sua conta de água. Em setembro, tanto o consumo de
energia elétrica, quanto o de água, na residência de Pedro, foram iguais aos
consumos do mês de agosto. Porém, como as tarifas de água é energia elétrica foram 3
reajustadas em 10% e 20%, respectivamente, Pedro desembolsou R$ 20,00 a mais do
que em agosto para quitar as duas contas. Quanto Pedro pagou de energia elétrica no 49
mês de setembro?

NEED - Núcleo de Estudo em Educação a Distância


04 - No mês de janeiro de determinado ano, uma categoria profissional tem direito
a um aumento salarial de 75%. Como a categoria já havia recebido uma antecipação
de 25% em novembro, qual deve ser a porcentagem de acréscimo adicional do
salário para compensar a antecipação concedida?

05 - Um comerciante compra uma peça de tecido de 50m. Se ele vender 20m com
um lucro de 50%, outros 20m com um lucro de 30% e os restantes pelo preço de
custo, calcule seu percentual de lucro na venda da peça.

06 - Sabendo-se que o Índice Geral de Preços ( IGP ) de junho de 2002 foi de 1,74%
e no mês de julho do mesmo ano foi de 2,05%, qual o percentual de aumento de um
mês para o outro?
Um outro fato também importante, é que as percentagens podem ser utilizadas de
inúmeras formas, segundo a circunstância que queiramos estudar. Vejamos dois
casos:

Primeiro: Quando quisermos analisar a estrutura de um fato, deveremos ratear as


porcentagens entre os itens que compõem esse fato.

Consideremos a série:
UPE - Universidade de Pernambuco

Matrículas nas Instituições de Ensino da cidade Z ano 2000

Categorias Número de Alunos (Dados Absolutos)

Ensino Fundamental 19286


Ensino Médio 1681
Ensino Superior 234

Total 21201

Fonte: Dados Fictícios


3
50 Calculemos as percentagens dos alunos de cada nível de ensino:
NEED - Núcleo de Estudo em Educação a Distância

19286 x100
Ensino Fundamental ? ?
90,96 Isto nos leva a
21201
91,0%

1681x100
Ensino Médio ? ?
7,92 Isto nos leva a
21201
7,9%

234 x100
Ensino Superior ? ? 1,10 Isto nos leva a
21201
1,1%

Observe a soma:
91,0% + 7,9% + 1,1% = 100%
Com esses dados podemos formar uma nova coluna na série em estudo:

Matrículas nas Instituições de Ensino da cidade Z ano 2000

Categorias Número de Alunos % (Dados Relativos)

Ensino Fundamental 19286 91,0


Ensino Médio 1681 7,9

UPE - Universidade de Pernambuco


Ensino Superior 234 1,1

Total 21201 100


Fonte: Dados Fictícios

Vamos agora fazer uma interpretação dos dados obtidos nesta nova coluna. Esses
valores nos dizem que, cada 100 alunos da cidade Z, 91 estão matriculados no Ensino
Fundamental, 8, aproximadamente, no Ensino Médio e 1 no Ensino Superior. Com
isto, podemos observar que o emprego da percentagem é de grande valia quando é
nosso intuito destacar a participação da parte no todo. Este estudo comparativo pode
ser muito útil na análise de dados numa série estatística, como podemos ver a seguir.
3
Consideremos, agora, a série:
51

NEED - Núcleo de Estudo em Educação a Distância


Número de alunos

Categorias Cidade Z Cidade T

Ensino Fundamental 19286 38660


Ensino Médio 1681 3399
Ensino Superior 234 424

Total 21201 42483


Fonte: Dados Fictícios

Qual das cidades tem, comparativamente, maior número de alunos em cada nível de
ensino?

Como o número total de alunos é diferente nas duas cidades, não é fácil concluir a
respeito usando os dados absolutos. Porém, usando as percentagens, tal tarefa
apresenta-se como a forma ideal para a resposta ao questionamento. Para tal, vamos
acrescentar na tabela anterior as colunas correspondentes às percentagens, relativa a
cada nível de ensino, para cada cidade.
Matrículas nas Instituições de Ensino das cidades Z e T no ano 2000

Cidade Z Cidade T

Categorias N° de Alunos % N° de Alunos %

Ensino Fundamental 19286 91,0 38660 91,0


Ensino Médio 1681 7,9 3399 8,0
Ensino Superior 234 1,1 424 1,0
UPE - Universidade de Pernambuco

Total 21201 100 42483 100


Fonte: Dados Fictícios

A análise. A resposta com os dados brutos não seria tão bem posta, como a que se
apresenta com os dados relativos. Pois, num primeiro olhar poderíamos fazer um
julgamento errôneo do fato, uma vez que a cidade T, aos olhos dos dados brutos,
apresenta mais estudantes em todos os níveis de ensino, se comparada com a cidade
Z. Mas, quando vamos dar uma olhada nos dados relativos, isto nos permite dizer
que, comparativamente, contam, praticamente, com a mesma taxa de estudante em
3 cada nível de ensino. Ou, com o mesmo número de estudantes para cada deles
tomados como referência 100. E, poderíamos informar que, para cada 100
52 estudantes, as cidades Z e T apresentam as mesmas taxas para os três níveis de
ensino.
NEED - Núcleo de Estudo em Educação a Distância

Observação:

Do mesmo modo que tomamos 100 para a base de comparação, também podemos
tomar outro número qualquer, como por exemplo, 1 ou 1000 (base decimal).

Segundo: Quando quisermos estudar a dinâmica de um fato, ou seja, acompanhar a


evolução de um fato ao longo do tempo, deveremos estabelecer um período seja
ano, mês, dia etc. -, uma produção, uma renda etc. como sendo a base,
considerando-a como 100%.
Base Fixa

Exemplo: Produção em toneladas da Metalúrgica “ABC” ano 1995 = 100

Anos Produção (t) Ano – base 1995 Variação


(%) Porcentual com
relação à base ( %
)
95 3200 100,0 —
96 3600 112,5 + 12,5

UPE - Universidade de Pernambuco


97 3360 105,0 + 5,0
98 3360 105,0 + 5,0
99 3200 100,0 0,0
00 2800 87,0 - 12,5
01 3440 107,5 + 7,5

Apenas as duas primeiras colunas fazem parte do enunciado

Base - 100%
Valores - x%
Com isto:
3
Valores ?
?
Percentagem ?
? ?
?Base ?
x100 53
Vejamos os cálculos:

NEED - Núcleo de Estudo em Educação a Distância


3200 ?
?
Ano 95 ??? x100 ?
100%
3200 ?
?

3600 ?
?
Ano 96 ??? x100 ?
112,5%
3200 ?
?

3360 ?
?
Ano 97 ??? x100 ?
105,0%
3200 ?
?

Exercício 3.2: Faça (continue) os cálculos para os anos: 1998; 1999; 2000 e 2001.
Comentários:

Os valores dessa nova coluna mostram como evoluíram a produção em termos


percentuais em relação ao ano1995 (base escolhida). Por exemplo:
De 1995 para 1996 a produção cresceu 12,5%.
De 1995 para 1997 a produção cresceu 5,0%.
De 1995 para 1998 a produção também cresceu 5,0%.
De 1995 para 1999 a produção foi a mesma, ou seja, não evoluiu.
UPE - Universidade de Pernambuco

De 1995 para 2000 a produção decresceu em -12,5%.


De 1995 para 2001 a produção cresceu 7,5%

Base móvel

Este caso difere do anterior, pois a base se modifica para cada dado. Onde, cada novo
dado sempre será relacionado com o dado anterior. Vejamos, o exemplo a seguir:

3 Exemplo: Produção em toneladas da Metalúrgica “ABC” Base Móvel.

Anos Produção (t) Base Móvel Variações % com


54 ( %) Relação à Base
95 3200 — —
NEED - Núcleo de Estudo em Educação a Distância

96 3600 112,5 + 12,5


97 3360 93,3 - 6,7
98 3360 100,0 0,0
99 3200 95,2 - 4,8
00 2800 87,5 - 12,5
01 3440 122,9 + 22,9

Apenas as duas primeiras colunas fazem parte do enunciado.

De forma similar ao caso da base fixa, temos:

Base – 100%
Valores – x%

Com isto:

Valores ?
?
Percentagem ?
? ? x100
?Base ?
Vejamos os cálculos:

95 ?
Não existe dado anterior, por tanto esse percentual é inexistente.

3600 ?
?
96 ?Percentagem ?
?? x100 ?
112,5%
3200 ?
?

3360 ?
?
97 ?Percentagem ?
?? x100 ?
93,3%
3200 ?
?

UPE - Universidade de Pernambuco


Exercício 3.3: Faça (continue) os cálculos para os anos: 1998; 1999; 2000 e 2001.

Comentários:

Os valores dessa nova coluna mostram como evoluem a produção de um ano para o
outro. Por exemplo:
De 1995 para 1996 tivemos um acréscimo na produção de 12,5%
De 1996 para 1997 a produção decaiu em -6,7%. 3
De 1997 para 1998 não houve alteração na produção.
55
De 1998 para 1999 a produção decaiu em -4,8%

NEED - Núcleo de Estudo em Educação a Distância


De 1999 para 2000 a produção também decaiu em -12,5%
De 2000 para 2001 a produção evoluiu em 22,9%.

2 - Índices

“Em termos gerais, um número-índice pode ser concebido como uma medida
estatística destinada a comparar, através de uma expressão quantitativa global,
grupos de variáveis relacionadas e com diferentes graus de importância. Através dele
obtém-se um quadro resumido das mudanças ocorridas em áreas afins (TOLEDO e
OVALLE, 1985, p. 311)”. Este resumo dá uma visão geral do referido tema, que aqui
será exposto apenas através das expressões quantitativas para um exercício de
configuração deste conteúdo.

Uma definição deste tema é dizer que, índices são razões entre duas grandezas tais
que uma não inclui a outra (grandezas independentes).
São exemplos de índices:

[a] Índice Cefálico


?DT ?
?
IC ?
? ?
x100
?
?D L ?

Onde:
IC = Índice Cefálico; DT = Diâmetro Transverso do Crânio; DL = Diâmetro
Longitudinal do Crânio
UPE - Universidade de Pernambuco

[b] Quociente Intelectual


?IM ?
?
QI ?
? ?
x100
?
?I C ?

Onde:
QI = Quociente Intelectual; IM = Idade Mental; IC = Idade Cronológica.

[c] Densidade Demográfica


?PT ?
?
DD ?
? ?
x100
?ST ?
?
Onde:
DD = Densidade Demográfica; PT = População Total; S T = Superfície Total.
3
56 Índices Econômicos
NEED - Núcleo de Estudo em Educação a Distância

[a] Produção Per capita


?
VP ?
?
PPC ? ?
?P ?
? ?
Onde:
PPC = Produção “per capita”; VP = Valor da Produção; P = População.

[b] Consumo Per Capita


?CB ?
C PC ?
? ?
?P ?
Onde:
CPC = Consumo “per capita”; CB = Consumo do Bem; P = população.

[c] Renda Per Capita


Rd
RDPC ?
P
Onde:
RDPC = Renda Per Capita; Rd = Renda; P = População.
[d] Receita Per Capita
RC
RC PC ?
P
Onde:
RCPC = Receita Per Capita; RC = Receita; P = População.

Exemplo:

UPE - Universidade de Pernambuco


Uma instituição beneficente possuía em 1993 a quantia de $ 200.000 diários para
atender a 4000 pessoas. Em 1996 a receita da instituição é de $ 800.000 para atender
a 8000 pessoas. Calcular a receita per capita da instituição e verificar se sua situação
por atendido melhorou ou piorou, considerando que no período de 93 a 96 houve
um acréscimo de 120% (isto é uma suposição!) no custo de vida.

Logo:
200000
1993 ?Receita per capita = ?
50
4000

800000 3
1996 ?Receita per capita = ?
100
8000
57
Porém:

NEED - Núcleo de Estudo em Educação a Distância


Houve um acréscimo de 120% ?
aumento de um fator de 220 (120 + 100).
Daí:

Para manter o mesmo padrão a instituição necessitaria de:

100 - 50
220 - x

Resolvendo:
X = 110 a instituição piorou, pois necessitaria de $10 a mais do
que é hoje (1996) a sua renda per capita.
3 - Coeficientes

É a comparação entre duas grandezas em que uma está contida na outra.

São exemplos de coeficientes:

[a] Coeficientes de Natalidade


NN
CN ?
PT
UPE - Universidade de Pernambuco

Onde:
CN = Coeficiente de Natalidade; NN = Número de Nascimento; PT = População
Total.

[b] Coeficiente de Mortalidade


NO
CM ?
PT
Onde:
CM = Coeficiente de Mortalidade; NO = Número de Óbitos; PT = População Total.

3 Coeficientes Educacionais

58
[a] Coeficiente de Evasão Escolar
NEED - Núcleo de Estudo em Educação a Distância

NE
C EE ?
N IM
Onde:
CEE = Coeficiente de Evasão Escolar; NE = Número de alunos Evadidos;
NIM = Número Inicial de Matricula

[b] Coeficiente de Aprovação Escolar


NA
C AE ?
N FM
Onde:
CAE = Coeficiente de Aprovamento Escolar; NA = Número de alunos Aprovados;
NFM = Número Final de Matrícula

[c] Coeficiente de Recuperação Escolar


NR
C RE ?
N AR
Onde:
CRE = Coeficiente de Recuperação Escolar; NR = Número de alunos Recuperados;
NAR = Números de Alunos em Recuperação.
4 - Taxas

É a mes ma coisa que coeficiente, apenas apresentando -se multiplic ada por uma
potência de 10 (dez) (10, 100, 1000 etc.) para tornar o resultado mais inteligível, uma
vez que sempre especificamos os dados em formas relativas. Desse modo temos a
expressão:

Taxa = Coeficiente x 10 n com n = 1, 2, 3, .....

Exemplos de taxas:

UPE - Universidade de Pernambuco


[a] Taxa de Mortalidade - TM
TM = CM x 103
(ver o CM na parte de Coeficientes)

[b] Taxa de Natalidade - TN


TN = CN x 103
(ver o CN na parte de Coeficientes)

[c] Taxa de Evasão Escolar - TEE


TEE = CEE x 102
(ver o CEE na parte de Coeficientes)
3
[d] Taxa de Morbidade - TMB
Calculada para casa doença em particular, aqui a tuberculose. 59
Numa determinada cidade, relativa a um certo período (meses, ano, decênio, etc) Y.

NEED - Núcleo de Estudo em Educação a Distância


Teremos:
TMB = CMB x 103
Onde:
n
C MB ?
Pn
Sendo:
CMB = Coeficiente de Morbidade; n = número de acometidos por tuberculose no
município X,
no ano Y; Pn = População do município X, no ano Y.

[E] Taxa de Acidentes de Trabalho


Neste caso, ela se divide em duas partes: [i] Freqüência da Taxa de Acidentes de
Trabalho; [ii] Gravidade da Taxa de Acidentes de Trabalho.
Vejamos a primeira:
TATf ?
C ATf x10 6
Onde:
N ac
C ATf ?
N OH
Sendo:
C ATf = Coeficiente da freqüência dos Acidentes de Trabalho; Nac = Número de
acidentes;
NOH = Número de Operários Hora.
UPE - Universidade de Pernambuco

Vejamos a segunda:
TATg ? g
C AT x10 6
Onde:
g N HPA
C AT ?
N OH
Sendo:
g
C AT = Coeficiente da gravidade nos Acidentes de Trabalho; NHPA = Número de Horas
Perdidas em razão dos acidentes; NOH = Número de Operários Hora.

Convém salientar que o n° de horas perdidas por acidente se conhece tendo em


3 conta, além das horas que o acidentado deixou de trabalhar, a utilização de uma
tabela específica que proporciona uma equivalência entre os tipos de incapacidade e
60 o número de horas deb itadas à empresa em virtude do acidente. Por exemplo: perda
de uma mão equivale a 3000 horas perdidas, surdez em um ouvido equivale a 600
NEED - Núcleo de Estudo em Educação a Distância

horas perdidas etc.

Exercícios Resolvidos

I - Calcular a taxa freqüência e de gravidade em uma empresa em que, operando com


50 operários, trabalhando 500 horas cada um, ocorreram 5 acidentes com uma perda
de 200 horas.
5
TATf ? x10 6 ? 200
50 x500

O que significa que nesta empres a, em cada 1000000 de operários –hora, ocorreram
200 acidentes.
200
TATg ? x10 6 ? 8000
50 x500

O que significa que, nesta empresa, em cada 1000000 de operários–hora, 8000 horas
são perdidas em virtudes de acidentes.
II - A cidade X apresentou 12793 matr ículas nas séries iniciais, no iní cio do semestre
2000 e , 10347 no fim do ano 2000. A cidade Y apresent ou os seguintes números:
8349 no iní cio de 200 0 e 6649 matrí culas no final de 2000. Qual e a cidade que
apresentou mais evasão escolar?

Cidade X:
NE
Como: TEE = CEE x 102 mas C EE ? onde N E = Número de alunos
N IM
evadidos.
Logo:

UPE - Universidade de Pernambuco


NE = 12793 – 10347 = 2446 e que NIM = 12793 com isto CEE = 0,191
Daí:
TEE = 0,191 x 102 = 0,191 x 100 = 19,1%

Cidade Y:
NE
Como: TEE = CEE x 102 mas C EE ? onde N E = Número de alunos
N IM
evadidos.
Logo:
NE = 8349 – 6649 = 1700 e que NIM = 8349 com isto CEE = 0,204
Daí:
TEE = 0,204 x 102 = 0,204 x 100 = 20,4% 3
Conclusão: a cidade que apresentou a maior evasão escolar foi a cidade Y. Observe 61
que o valor do coeficiente já diz esta realidade, porém, a informação em termos

NEED - Núcleo de Estudo em Educação a Distância


percentuais dá uma realidade maior ao fato, um vez que podemos compreendê -lo na
formação de um todo (100%).

III - Em uma cidade cuja população é 520000 habitantes, o números de óbitos


registrados é de 80080. Calcular a taxa de mortalidade.

Resolução:
Temos: Número de óbitos: NO = 80080 e que a População Total : P T =
520000

Como
NO 80080
CM ? logo CM ? ?
0,154
PT 520000
Mas:
TM = CM x 103 logo TM = 0,154 x 10 3 = 0,154 x 1000 =
154 0 00
Ou Seja:

Tivemos 154 óbitos para cada 1000 habitantes.


Exercícios 3.4

[1] Considere a série estatística: Complete-a, determinado as


percentagens com uma casa
Séries Alunos Matriculados %
decimal e fazendo a compensação
1ª 546
2ª 328 (arredondamento), se necessário.
3ª 280 Exemplos: [a] 32,4823% fica 32,5;
4ª 120 [b] 12,237% fica 12,2%; [c] 6,971%
Total 1274
Fonte: Dados Fictícios fica 7,0%; [d] 8,3452% fica 8,3%.
UPE - Universidade de Pernambuco

[2] Considere a tabela abaixo:

Evolução das receitas do Café industrializado de Janeiro até Abril do ano de 2002

[a] Complete-a com uma coluna de


Meses Valor(US$ milhões) %
taxas percentuais.
Janeiro 33,3 [b] Como se distribuem as receitas
3 Fevereiro
Março
54,1
44,5
em relação ao total?
[c] Qual o desenvolvimento das
Abril 52,9
receitas de um mês para outro?
62 Total 184,8 [d] Qual o desenvolvimento das
receitas em relação ao mês de
NEED - Núcleo de Estudo em Educação a Distância

Fonte: Dados Fictícios janeiro?

[3] Um professor preencheu um quadro, enviado pela D.E, com os seguintes dados:

Série e N° de N° de Promovidos Retidos em recu- recupera- não recu- Total Geral


Turma Alunos Alunos sem recupe - sem recu- perção dos perados promo-
30/03 30/11 ração peração vidos Retidos

1° B 49 44 35 03 06 05 01 40 04
1° C 49 42 42 00 00 00 00 42 00
1° E 47 35 27 00 08 03 05 30 05
1° F 47 40 33 06 01 00 01 33 07

Total 192 161 137 09 15 08 07 145 16


Calcule:

[A] A taxa de evasão, por classe;


[b] A taxa de evasão total;
[c] A taxa de aprovação, por classe;
[d] A taxa de aprovação geral;
[e] A taxa de recuperação, por classe;

UPE - Universidade de Pernambuco


[f] A taxa de recuperação geral;
[g] A taxa de reprovação na recuperação geral;
[h] A taxa de aprovação, sem a recuperação;
[i] A taxa de retidos, sem a recuperação.

[4] Considerando que em uma região temos os seguintes dados:

População = 1784327 habitantes


3
Superfície = 137420 km²
Nascimentos em 1 ano = 42327 nascidos vivos 63
Mortes em 1 ano = 16230 óbitos

NEED - Núcleo de Estudo em Educação a Distância


Calcular:

[a] Coeficiente de natalidade e taxa de natalidade (por 1.000 hab.)


[b] Coeficiente de mortalidade e taxa de mortalidade (por 10.000 hab.)
[c] Índice da densidade demográfica

[5] Uma cidade de 320000 habitantes apresenta uma taxa de natalidade de 3,2% ao
ano e uma taxa de mortalidade de 27% ao ano. Calcular o aumento da população em
um ano.

[6] Uma entidade assistencial em 1998 atendia 500 internos com uma verba de
R$200.000,00. Em 2003, os internos aumentaram em 20%, enquanto que a verba
aumentou 50%. Sabendo-se que o custo de vida, pela desvalorização da moeda,
aumentou em 40% no mesmo período, indaga-se se a situação financeira da
entidade, por interno atendido, melhorou ou piorou?

[7] Em uma empresa que possui 250 operários, trabalhando durante 60 dias de 8
horas cada um, verificaram-se 32 acidentados de trabalho, ocasionando uma perda
de 146 horas. Calcular a taxa de freqüência e de gravidade de acidente do trabalho.
UPE - Universidade de Pernambuco

3
64
NEED - Núcleo de Estudo em Educação a Distância
Referência Bibliográfica

CRESPO , Antônio Arnot. Estatística Fácil. 17ª Edição, São Paulo, SP; Ed.
Saraiva,1999.

MARTINS, G.A, Donaire,D. Princípio de Estatística. 4ªedição. São Paulo,


SP: Ed. Atlas, 1990.

NAZARETH, Helenalda. Curso Básico de Estatística. 12° Edição. São


Paulo, SP: Ed. Ática, 2000.

SPIEGEL, MR. Estatística. 2ª edição. São Paulo, SP: Ed. Mcgranw Hill,
1985.
Medidas de Tendência
Central e Separatizes FASCÍCULO

Carga Horária - 10 horas


Gilberto Pereira da Silva
Mário de Souza 4
Objetivos

-Compreender o significado de medidas de posição ou de


tendência central.
-Entender estas medidas de posição em situações problema.
-Conhecer a utilidade, vantagens e desvantagens dessas
medidas.
Introdução

Há diversas medidas que possibilitam condensar as informações dentro


da fase analítica da estatística descritiva. Neste capítulo, concentraremos
nossa atenção nas medidas de posição ou de tendência central
(promédios), as quais são assim denominadas, em virtude da tendência
de os dados observados se agruparem em torno desses valores centrais.
A moda, a média aritmética e a mediana são as três medidas de tendência
UPE - Universidade de Pernambuco

central ou promédios mais utilizados para resumir o conjunto de valores


representativos do fenômeno que se deseja estudar. Outros promédios
menos usados são a média geométrica, harmônica, quadrática, cúbica e
biquadrada.

1. Médias

O número destinado a resumir uma série de dados diz-se média, designação que
significa que a síntese deve ser um valor intermediário aos valores dados, não
4 devendo ser inferior ao menor termo da série, nem superior ao maior deles.

68
A média deve satisfazer, os números que representam algumas condições lógicas ou
NEED - Núcleo de Estudo em Educação a Distância

propriedades. O critério de escolha apropriado, de determinado tipo de média, para


representar um conjunto de valores, obedece às propriedades da síntese escolhida e
aos objetivos que nos levam a procurar a própria expressão sintética.

Principais Médias:
[a] Aritmética.
[b] Geométrica.
[c] Harmônica.
[d] Potência (cúbica, biquadrada, etc.).

Podendo ainda cada uma delas ser simples ou ponderada.

Onde:
Médias simples: são aquelas obtidas do conjunto cujos elementos têm a mesma
importância ou o mesmo peso.

Médias ponderadas: são aquelas resultantes de conjuntos compostos de elementos


de importância ou freqüência diferenciada.

Vejamos agora cada uma das Médias

UPE - Universidade de Pernambuco


1.1 Média Aritmética: é uma das principais medida de posição, cuja aplicação é
seguramente a mais usada, sendo que pode ser simples (dados não agrupados) e
ponderadas (dados agrupados).

1.1.1 - Média Aritmética para dados não agrupados


Para uma seqüência numérica x1, x2,..., x3, x n portanto, “n” valores da variável x. A
média aritmética simples de x representada por x é definida por:

?
x
n

i
4
i?
1
x?
Exemplo 1:
n
69

NEED - Núcleo de Estudo em Educação a Distância


Determinar a média aritmética simples dos valores 2, 0, 5 e 3.

i?
1
?
x
2?
0?i
5?
3
x? ? ?
2,5
4 4

1.1.2 - Média Aritmética para dados agrupados


Quando os dados estiverem agrupados numa distribuição de freqüência, usaremos a
média aritmética dos valores x1, x2, x3,..., xn , ponderados pelas respectivas freqüência
absolutas F1 , F2, F3 , ..., Fn . Para n dados, teremos:
n

i?
1
?
x .F i i
x?
n
Exemplo 2.

Dada a seguinte distribuição amostral, determinar a média (dados agrupados sem


intervalo de classe, ou seja, contém apenas elementos repetidos ou com freqüência).

xi 2 5 6 8
Fi 1 4 3 2

Solução: inicialmente vamos construir uma tabela com os elementos xi e Fi para em


UPE - Universidade de Pernambuco

seguida produzir o produto xi .Fi . Depois somar a coluna de freqüência sim ples e
somar o produto de cada elemento da série pela sua freqüência, para depois calcular
a média.

xi Fi xF
ii
4

?
x .F
i?
1 56i i
x? 4
? ?
5,6
10
? Fi
i?
1
4
70
Interpretação:
NEED - Núcleo de Estudo em Educação a Distância

O valor médio da amostra 5,6 é o ponto de concentração dos valores da amostra.

Exemplo 3:

Determinar a média aritmética das alturas (x) dos estudantes de uma classe de Ensino
Médio apresentada na tabela abaixo (dados agrupados com intervalo de classe).

x(cm) xi Fi xF
ii
Calculando:

5 ?
x .Fi
6465i

?
n?Fi ?
40 x? i?
1
? ?
5
40
161,6cm
i?
1
?
Fi
i?
1

Interpretação:

UPE - Universidade de Pernambuco


A altura média desta turma é, aproximadamente, 162 cm, a altura na qual se
concentra o maior número de estudantes (ver tabela).

1.2 Média Geométrica: denominamos média geométrica de um conjunto de “n”


valores a raiz n-ésima do produto desses “n” valores.

1.2.1 Média Geométrica para dados não agrupados

n 4
xg ?
n
?
xi ou que
i?
1
xg ?
n x .x .x ...x
1 2 3 n

71
Exemplo 4:

NEED - Núcleo de Estudo em Educação a Distância


Calcule a Média Geométrica dos dados 3, 5, 7 e 9.
4 4
xg ? 3 x5 x 7 x9 ? 945 ?
5,5

1.2.2 Média Geométrica para dados agrupados

Sejam x1, x2, x3, ..., Xn valores de x, associados às freqüência absolutas F1, F2, F3, ..., Fn
respectivamente. Então, a média geométrica de x é:
n n
xg ?
n xiFi ou que x g ?
? n
x1F1 .x2F2 .x3F3 ...xnFn ?
onde n ?Fi
i?
1 i?
1
Observação:

Em particular, se , temos o caso da Média Geométrica não agrupada.

Exemplo 5:

Calcular a média geométrica para a distribuição abaixo (sem intervalo de classe):

xi 1 2 3 5
Fi 8 6 5 3
UPE - Universidade de Pernambuco

Teremos:
22 8
xg ? 1 x 2 6 x 35 x 5 3 ?
22 22
1x64 x 243 x125 ? 1944000 ?
1,93

Nota:

Quando o número de dados for muito grande, é aconselhável o emprego de


logaritmos.
4
Como:
72 xg ?
n
x1F1 .x2F2 .x3F3 ...xnFn
NEED - Núcleo de Estudo em Educação a Distância

Logo:

n
F1 log x1 ?
F2 log x2 ?
F2 log x3 ?
... ?
Fn log xn
log x g ?
n i?
1
?
sendo n ?Fi

Vejamos a solução deste exemplo usando o logaritmo

8 log1 ?
6 log 2 ?5 log 3 ?
3 log 5 8 x0 ?
6 x0,3010 ?
5 x0,4741 ?
3 x0,6990
log x g ? ? ?
0,2858
22 22

Daí:
n

?
F log x
i i n
xg ?
anti log i?
1

n
?
com n ?Fi
i?
1

O que nos leva a:

xg ?
1,93 que é o mesmo resultado anterior.
Exemplo 6:

Calcular a média geométrica para os dados da tabela abaixo (com intervalo de


classe).

Estatura dos alunos da FFPNM


Turma do curso de Licenciatura Plena em Biologia, ano 2003

UPE - Universidade de Pernambuco


Estatura (cm) Fi xi log xi Fi log xi
150 |— 156 5 153 2,18469 10,92345
156 |— 162 4 159 2,20139 8,80556
162 |— 168 19 165 2,21748 42,13212
168 |— 174 18 171 2,23300 40,19400
174 |— 180 14 177 2,24797 31,47158
180 |— 186 12 183 2,26245 27,14940
186 |— 192 4 189 2,27646 9,10584
? 76 — — 169,78195

4
Resolvendo:
73

NEED - Núcleo de Estudo em Educação a Distância


169,78195
xg ?
anti log ?
anti log 2,234 ?
171,4cm
76

(observe que a construção da tabela, com seus respectivos valores de interesse, é


muito importante para facilitar na construção dos dados e sua colocação na
expressão matemática)

1.3 Média Harmônica: É o inverso da média aritmética dos valores.

1.3.1 Média Harmônica para dados não agrupados

n
xh ?n
1
?
i?1 xi
Exemplo 7:

Calcular a média harmônica dos valores 2, 5, 7 e 9.

Temos:

4 4 4 x630
xh ? ?? ? 4,2
1 1 1 1 601 601
? ? ?
UPE - Universidade de Pernambuco

2 5 7 9 630

1.3.2 Média Harmônica para dados agrupados

Sejam x1, x2, x3, ..., xn valores de x, associados às freqüências absolutas F1, F2, F3, ..., Fn
respectivamente.

A média harmônica de x é definida pela seguinte expressão:


4
74 xh ?
n
F1 F2 F3 Fn
?n
n
Fi
onde ?
n?
n
Fi
? ? ... ? ?
? i?
1
NEED - Núcleo de Estudo em Educação a Distância

x1 x2 x3 xn i?1 xi

Exemplo 8:

Calcular a média harmônica dos dados (sem intervalo de classe) da tabela abaixo.

xi Fi Fx
i / i

?
Apenas as duas primeiras colunas fazem parte do enunciado.
(A terceira coluna é construída como de interesse na solução do problema).
Resolvendo:
n

i? 1
i ?
F
24
Neste caso, temos xh ?n
o que nos leva a: xh ?? 3,7
Fi 6,5
?
i?1 xi

Exemplo 9:

Calcular a média harmônica para os dados das estaturas dos alunos do curso de
Licenciatura Plena em Biologia, da Faculdade de Formação de Professores de Nazaré

UPE - Universidade de Pernambuco


da Mata, do ano de 2003, mostrada na página 5 (com intervalo de classe).

Solução:

Vamos construir uma coluna (na tabela de dados) com a fração (e sua soma) Fi / xi ,
que é uma coluna de interesse na solução do problema, uma vez que a mesma serve
para uma melhor identificação dos dados na expressão matemática de interesse.

Estatura (cm) Fi xi Fi / xi 4
150 |— 156 5 153 0,03268
156 |— 162 4 159 0,02516 75
162 |— 168 19 165 0,11515

NEED - Núcleo de Estudo em Educação a Distância


168 |— 174 18 171 0,10526
174 |— 180 14 177 0,07910
180 |— 186 12 183 0,06557
186 |— 192 4 189 0,02116
? 76 — 0,44408

Resolvendo:

?
F
i? 1
i
76
xh ? n
? xh ? ?
171,1cm
Fi 0,44408
?
i? 1 xx
1.4 Média quadrática: É a raiz quadrada da média aritmética dos quadrados dos
elementos da série.

1.4.1 Média Quadrática para dados não agrupados

n
2
?
x
i?
1
i
xq ?
UPE - Universidade de Pernambuco

Exemplo 10:

Calcular a média quadrática da série 6, 17, 9, 9, 3, 13 ,9 e 1.

Na solução desse exercício é bom construir uma tabela com os xi e seus valores
quadráticos, bem como a soma desses valores quadráticos, para aplicação na
4 expressão matemática.

76 6 17 9 9 3 13 9 1 SOMA
xi
NEED - Núcleo de Estudo em Educação a Distância

xi2 36 289 81 81 9 169 81 1 747

Daí:

747
xq ? ? 93,375 ?
9,7
8

1.4.2 Média quadrática para dados agrupados

n
2
?
x .F i i n
xq ? i?
1
n
com ?
n?Fi
?
F
i?
1
i
i?
1
Exemplo 11:

Calcular a média quadrática para os dados (sem intervalo de classe) da tabela abaixo.

xi Fi xi2 xi2 .Fi


2 1 4 4
5 4 25 100
6 3 36 108
8 2 64 128
SOMA 10 340

UPE - Universidade de Pernambuco


Apenas as duas primeiras colunas fazem parte do problema.

(as outras duas colunas são construídas em função da necessidade de trabalhar a


expressão matemática para calcular a média quadrática com dados repetidos)

Resolvendo:

?
x .F 2
i i
340
4
i?
1
Temos: xq ? n
o que nos leva a: xq ? ? 34 ?
5,8
14
?
F
i?
1
i 77

NEED - Núcleo de Estudo em Educação a Distância


Exemplo 12:

Em uma pesquisa sobre a duração de certa pasta dental junto a 50 famílias do mesmo
tamanho e classe social os resultados foram abaixo descritos. Calcular a duração
média da pasta dental (com intervalo de classe).

Dias Número xi xi2 xi2 .Fi


de (ponto
Famílias médio)
(Fi)
10/12 8 11 121 968
12/14 12 13 169 2028
14/16 20 15 225 4500
16/18 10 17 289 2890
SOMA 50 10386
Apenas as duas primeiras colunas fazem parte do problema. A terceira coluna é
construída com a finalidade de ajudar na colocação dos dados na expressão
matemática.

Resolvendo:
n
2
?
x .F
i?
1
i i
10386
xq ? n
? ?
14,4dias
50
?
UPE - Universidade de Pernambuco

F i
i?
1

Exercícios resolvidos dos temas até agora desenvolvidos

I - Calcular as médias: aritmética, geométrica, harmônica e quadrática dos seguintes


conjuntos de números:

[a] X= {2, 4, 6, 8,10}

4 [b] Y= {10, 10,10}

78 Solução:
NEED - Núcleo de Estudo em Educação a Distância

[a] Para a série


n

i?
1
?
x
2?
4?
6?
8?
10 i
Média Aritmética ?xA ? ? ?
6
n 5

n
Média Geométrica ?xg ?
n
? 5
xi ? 5
2 x 4 x6 x8 x10 ?
i?
1
3840 ?
5,2

n 5 5 5 x120 600
Média Harmônica ?xh ?n
? ? ? ?? 4,4
1 1 1 1 1 1 137 137 137
?
i?1 xi
? ? ??
2 4 6 8 10 120

n
2
?
x
2 i?
1
i 2
42 ?
? 62 ?
82 ?
10 2 220
Média Quadrática ?xq ? ? ? ? 44 ?
6,6
n 5 5
Como pode ser notado através deste exemplo xh ?
xg ? xq pois: 4,4 < 5,2 < 6 <
xA ?
6,6.

Observação:

Relacionamento entre as médias e os elementos extremos (mínimo e máximo) da


série.

UPE - Universidade de Pernambuco


xmin ?
xh ?
xg ?
xA ?
xq ?
xmáx

[b] Para a série Y = {10,10,10}

Como todos os valores da série são iguais, então: y h ?


yg ?
yA ?
yq ?
10

II - Calcular a média ponderada dos números 4, 2 e 5, atribuindo a estes,


respectivamente, pesos 3, 2 e 4. 4

Resolução:
79

NEED - Núcleo de Estudo em Educação a Distância


n

i?
1
?
p .x i i
(3 x 2) ?
( 2 x 2) ?
(4 x5) 36
x? n
? ? ?
4
3?
2?
4 9
? pi
i?
1

III - Um professor de Estatística leciona para três turmas (A, B e C) de 1° período do


curso de estatística em uma determinada faculdade. Sabemos que as turmas
apresentam as seguintes médias em um dado período:

Turma A (30 alunos) ............... média 8,0


Turma B (20 alunos) ................média 9,0
Turma C (50 alunos) ............... média 6,0

Calcular a média da disciplina de estatística das três turmas juntas e no período em


questão.
Resolução:

neste caso, teremos a média final do conjunto ( x f ) que é uma média ponderada com
pesos representados pelos números de termos das séries componentes desse
conjunto.

i?
1
?
n .x i i
(30 x8) ?
(20 x9) ?
(50 x6) 720
xf ? n
? ?? 7,2
30 ?
20 ?
50 100
? ni
UPE - Universidade de Pernambuco

i?
1

IV - Um vendedor viaja da cidade “A” para cidade “B” a 50 km/h e volta a 90km/h.
Determinar a velocidade média de toda a viagem. (Observe que a distância
percorrida é a mesma)

Resolução:

a média harmônica é, particularmente, recomendada para uma série de valores que


4 são inversamente proporcionais, como para o cálculo de velocidade média, tempo
médio de escoamento de estoques, custo médio de bens comprados com uma
80 quantia fixa etc.
NEED - Núcleo de Estudo em Educação a Distância

n 2 2 2 2 x 450 900
v?
xh ?n
? ? ? ? ?? 64,3km / h
1 1 1 9? 5 14 14 14
?
i?1 xi
?
50 90 450 450

Observação:

Se as distâncias não forem iguais, devemos utilizar a média harmônica ponderada em


que as freqüências ou pesos serão as respectivas distâncias.

V Um carro percorre 80km com uma velocidade escalar média de 40km/h, 150km
com velocidade escalar média de 50km/h e os 200km restantes de sua viagem a uma
velocidade média de 100km/h. Qual a velocidade média em todo o percurso?

Resolução:
Neste caso temos o fato de que as distâncias percorridas pelo móvel têm valores
diferentes, e estes valores vão passar a ser as freqüências (dados sem intervalos de
classe) para a média harmônica, com o intuito de calcular a velocidade escalar média
de todo o percurso.

?
F
i? 1
i
80 ?
150 ?
200 430 430
v?
xh ? ? n
? ?? 61,4km / h
F 80 150 200 1400 7
?1 xi
i?
? i
?
40 50 100 200

UPE - Universidade de Pernambuco


VI - Uma empresa possui um estoque de 20.000 unidades na cidade x e de 32000
unidades na cidade y. O primeiro esgota-se em quatro meses, e o segundo, em oito
meses. Determinar o tempo médio de escoamento de ambos os estoques.

Resolução:

n ?
2000032000
tx ?
h ?
n
?
Fi 2000032000
?
5,78 meses 4
?
i?
1 xi 4
?
8
81

NEED - Núcleo de Estudo em Educação a Distância


VII - A contagem de bactérias , em uma certa cultura, aumentou de 1000 para 4000
em três dias. Qual foi a percentagem média de acréscimo por dia?

Resolução:

para determinar essa percentagem média de acréscimo, representa -se o acréscimo


por r, então:

Contagem total de bactérias depois do 1° dia:


1000 + 1000r = 1000.(1 + r)
Contagem total de bactérias depois do 2° dia:
1000.(1 + r) + 1000.(1 + r)r = 1000.(1 + r)²
Contagem total de bactérias depois do 3° dia:
1000.(1 + r)² + 1000.(1 + r)²r = 1000.( 1 + r)³ .
Esta ultima expressão deve ser igual a 4000, e assim sendo temos que:

(1 + r) 3 = 4 ?
1000.(1 + r)³ = 4000 ? 1+r= 3 4 ?
1 + r = 1,587 ?
r=
0,587
Ou que:
r = 0,587 x 100% = 58,7%

Observação:

De uma maneira geral, se parte de uma quantidade P, que cresce a uma taxa
constante r por unidade de tempo, tem-se, após “n” unidades de tempo, um total:

T = P.(1 + r) n
UPE - Universidade de Pernambuco

Tarefa 4.1

01 - Calcular, as médias aritmética, geométrica, harmônica e quadrática da série


(dados em metros cúbicos): 3,7; 8,2; 10,0 e 15,0. Em seguida, faça a comparação
(ordem decrescente) dos valores encontrados.

02 - Calcule a idade média dos alunos de uma classe de primeiro ano de determinada
4 faculdade, em anos.

82 Idades ( anos ) xi N° de alunos Fi


17 3
NEED - Núcleo de Estudo em Educação a Distância

18 18
19 17
20 8
21 4

03 - Turmas que possuem determinada disciplina em comum apresentam nessa


disciplina as seguintes médias:

Turma A (40 alunos) média 6,5


Turma B (35 alunos) média 6,0
Turma C (35 alunos) média 4,0
Turma D (20 alunos) média 7,5

Determine a média geral da disciplina nesta faculdade.


04 - Uma pesquisa para determinar a eficiência de uma nova ração para animais, em
termos de ganho de peso, mostrou que após um mês em que a ração normal foi
substituída pela nova ração, os animais apresentam um aumento de peso segundo a
tabela:

Classe Aumento de peso em kg N° de animais Fi

1 0 |— 1 1
2 1 |— 2 5

UPE - Universidade de Pernambuco


3 2 |— 3 35
4 3 |— 4 37
5 4 |— 5 28

[a] Calcular o aumento médio de peso por animal.


[b] Se a ração antiga proporcionava em iguais circunstâncias um aumento médio de
peso de 3,100 kg/animal, esta nova ração pode a princípio ser considerada mais
eficiente?
4
05 - A contagem de bactérias, em certa cultura, aumentou de 500 para 2000 em três
dias. Qual foi a porcentagem média de acréscimo por dia?
83

NEED - Núcleo de Estudo em Educação a Distância


06 - Encontrar dois números cuja média aritmética é 50, e a média harmônica, 32.

1.5 Outras Médias

Outras médias menos usadas em estatística são a média cúbica e a média


biquadrática, as quais são calculadas respectivamente, através das seguintes
expressões:

1.5.1 Média Cúbica

n
3

i?
1
3
?
x i
xc ? ?[a] Mc simples (dados não agrupados)
n
n
3
3
i?
1
?
xF ii
xc ? ?[b] Mc ponderada (com ou sem intervalo de classe)
n

1.5.2 Média Biquadrática ( xbq )

n
4

i?
1
4
?
x i
xbq ? ?[a] Mbq simples (dados não agrupados)
n
UPE - Universidade de Pernambuco

n
4
4
i?
1
?
xF i i
xbq ? ?[b] Mbq ponderada (com ou sem intervalo de
n
classe)

Tarefa 4.2:

4 [a] Calcule a média cúbica e biquadrática da série de números: 1, 2, 1, 3 e 5.

84 [b] Calcule a média cúbica e biquadrática de 1, 2 e 3 com cada um deles com


freqüência 10, 4 e 5, respectivamente.
NEED - Núcleo de Estudo em Educação a Distância

[c] Calcule a média cúbica e biquadrática do exercício 04, da tarefa 4.1.

2. Mediana e Demais Separatrizes

Mediana: é o valor que ocupa a posição central de um conjunto de dados ordenados.

Cálculo da Mediana

Para calcular a mediana vamos fazer uso de três técnicas diferentes para os cálculos:
[a] Dados brutos ou rol, neste cálculo tem apenas os dados na forma não agrupados;
[b] Dado repetido, neste caso os dados agrupados são sem intervalo de classe; [c]
Dados agrupados em classes, ou seja, neste item temos os intervalos de classe.
Observe que essas três formas de agir são as mesmas que vínhamos trabalhando
para as médias.
[a] Dados brutos ou rol

Inicialmente devemos ordenar os elementos, caso sejam dados brutos, obtendo o


rol. Em seguida, determinaremos o número (n) de elementos do rol. Neste item,
vamos considerar dois casos: [1] quando o rol tiver uma quantidade “n” de números
ímpares; [2] quando o rol tiver uma quantidade “n” de números pares.

a.1 - Se “n” é ímpar

UPE - Universidade de Pernambuco


n? 1
O rol admite apenas um termo central que ocupa a posição P ? .
2

Exemplo 01:

Calcular a mediana da série 9,15,3,7,6,16,4,19 e 1.

Resolução: 4
colocando os números que compõem a série em ordem crescente de valor, temos:
1,3,4,6,7,9,15,16 e 19. 85

NEED - Núcleo de Estudo em Educação a Distância


n? 19110?
Como n = 9 (ímpar), a posição é P ? ? ? ? 5?5 P? ? .
2 2 2
Isto é, a mediana é o quinto termo da série ordenada de modo crescente ou
decrescente. Concluímos assim que a mediana é M e ? 7.

Observação:
A posição em que ocupa o valor 7, no rol, deixa a sua esquerda e a sua direita o
mesmo número de elementos, sendo, portanto, o elemento central da série.

a.2 - Se n é par

n
Neste caso, o rol admite dois termos centrais que ocupam as posições P ' ? e
2
n
P '' ? ?1 . A mediana é convencionada como sendo a média aritmética dos valores
2
que ocupa estas posições centrais.
Exemplo 02:

Determinar a mediana da série: 7,21,13,15,10,8,9,13.

Solução:

Ordenando estes elementos, obtemos: 7,8,9,10,13,13,15,21


UPE - Universidade de Pernambuco

O número de elementos é n = 8 (par)

As posições dos termos centrais são:

n 8 n
P' ?? 4 ou seja, 4ª posição e P '' ?
? ?
1?
4?5 que é a 5ª posição.
1?
2 2 2

Onde:

4 O elemento que ocupa a quarta posição na série é 10 e o elemento que ocupa a quinta
posição é 13. Portanto,
86
NEED - Núcleo de Estudo em Educação a Distância

Interpretação:

50% dos valores do rol são valores menores ou iguais a 11,5 e 50% dos valores do rol
são valores maiores ou iguais a 11,5.

[b] Determinação da mediana para o caso de dados repetidos

A mediana é encontrada da mesma forma que a mostrada para dados isolados,


sendo, entretanto ainda mais cômoda a sua determinação com o uso de freqüência
acumulada.
Exemplo 03:

Determinar a mediana da série: (caso em que o número de elementos é ímpar).

xi Fi Solução:
o n° de elementos de série é a soma de todas as freqüências, ou seja,
n = 23 (ímpar). Portanto, a série admite apenas um termo central
que ocupa a posição central que é a soma de 23 +1 dividido por 2,
que tem como resultado 12, compreendido como o décimo segundo
lugar no conjunto de números dados (que são 23).

UPE - Universidade de Pernambuco


Para encontrar este 12º elemento vamos construir uma tabela veja
? logo a seguir - em que apareça a freqüência acumulada, pois, assim
procedendo, podemos localizar na referida tabela o 12° elemento da
série de 23 elementos.

xi Fi Fac Note que o 1° elemento da série é 2. Em seguida, aparecem


quatro elementos iguais a 5. Totalizando (acumulando)
cinco elementos. Estes cinco elementos ocupam na série
as posições de primeiro ao quinto. Depois aparece mais 10
elementos iguais a 8, fazendo com que haja agora um
acúmulo de quinze elementos. Como a mediana está no 4
décimo segundo elemento, logo, ela está contida na classe
? terceira dessa série de dados. E, neste local o elemento 87
correspondente xi é o número 8. Sendo assim, a mediana

NEED - Núcleo de Estudo em Educação a Distância


desse conjunto de número é Me = 8.

Interpretação:

50% dos valores da série são menores ou iguais a 8, e 50% dos valores da série são
maiores ou iguais a 8.

Exemplo 04:

Calcular a mediana da série: (caso em que o número de elementos é par).


xi Fi Solução:
o n° de elemento da série é a soma de todas as freqüências, ou seja, n =
3 + 5 + 8 + 10 + 6 = 32. Portanto, n é um número par. Neste caso a
série admite dois termos centrais. O primeiro dele é o termo central, ou
seja, aquele em que n é dividido por dois, ou seja, 32 dividido por dois
que é igual a 16. Dizemos assim que o primeiro termo está na décima
sexta posição. E o outro termo, é a soma desse resultado (16) mais um,
ou seja, 17. Dizemos então que o outro termo que influi no cálculo da
mediana ocupa a décima sétima posição.
UPE - Universidade de Pernambuco

Para localizar estes dois elementos, construímos a freqüência acumulada crescente


da série.

xi Fi Fac As três primeiras posições da série são ocupadas, por


exemplo, iguais a 0. Da quarta à oitava posição os
elementos são iguais a 1. Da nona à décima sexta posição
os elementos são iguais a 2. Da décima sétima à vigésima
sexta posição os elementos valem 3. e, com isto, podemos
ver que, o 16º elemento é o número 2, enquanto que o 17º
4 elementos é o número 3. Uma vez que, nesse caso a
? mediana é a média aritmética dos dói números
88 encontradas nestas posições, podemos então afirmar que
a mediana desse conjunto de números é a média
NEED - Núcleo de Estudo em Educação a Distância

aritmética dos números 2 e 3 que corresponde a 2,5. Ou


seja, Me = 2,5

Interpretação:

50% dos valores da série são valores menores ou iguais a 2,5 e 50% dos valores da
série são valores maiores ou iguais a 2,5.

[c] Cálculo da Mediana para dados Grupados em Classes

Quando uma série contínua e grupada em classes de freqüência, a mediana


corresponde ao termo que divide a série em duas partes iguais, isto é, o valor que é
precedido e seguido por 50% (n/2) dos termos da série.
Em uma distribuição de freqüência, chama-se classe mediana à classe que contém a
mediana. Neste caso o cálculo para encontrar a mediana pode ser obtida por
interpolação em um gráfico de freqüência acumulada, resultando na expressão
matemática:

n/2?
? F ?
Me ? ? a?
Li ? h
? F ?

Onde:

UPE - Universidade de Pernambuco


Me ?mediana;
Li ?limite inferior da classe que contém a mediana (classe mediana);
n ? nº de termos da série e n/2 será, a posição da mediana, seja “n” par ou ímpar;
Fa ?freqüência acumulada da classe vizinha anterior à classe mediana;
F ? freqüência da classe mediana;
h ? amplitude da classe mediana.

Exemplo - 05:
4
Calcular a mediana de distribuição de notas dadas na tabela abaixo.
89
NOTAS ALUNOS - F Fa

NEED - Núcleo de Estudo em Educação a Distância


0? 10 3 3
10 ? 20 7 10
20 ? 30 12 22
30 ? 40 34 56
40 ? 50 48 104
50 ? 60 90 190
60 ? 70 54 248
70 ? 80 52 300
80 ? 90 15 315
90 ? 100 5 320
TOTAL 320 ------------------
--

Somente as duas primeiras colunas fazem parte do enunciado.


A terceira coluna fora acrescida em procedimento à solução do problema.
Resolução:

Como a fórmula de cálculo citada refere bastante sobre dados da classe mediana, é
muito importante a sua determinação, o que é feito através da posição (P = n/2) da
mediana e da coluna de freqüência acumulada. No caso, a posição da mediana é P =
n/2 =320/2=160.

Após completarmos a coluna de freqüência acumulada (Fa), observamos que a


UPE - Universidade de Pernambuco

mediana é o 160° termo da distribuição, e que a mesma pertence à classe 50 60,


onde se situam as 90 notas dos alunos com números de ordem 105,
106,107,...,159,160,161,...,192,193 e 194.

Finalmente, aplicando a Fórmula da mediana, temos:

n/2?
? F ? ? 160 ?104 ? ? 56 ? 560
Me ? ? a?
Li ? h?
50 ?
? 10 ?
? 50 ?
? 10 ?
? 50 ?? 56,2
? F ? ? 90 ? ? 90 ? 90

4 A mediana é igual à nota 56,2. Isto revela que tal resultado coloca um certo número
de alunos com notas inferiores a 56,2 bem como, aqueles alunos com notas
90 superiores a 56,2.
NEED - Núcleo de Estudo em Educação a Distância

2.1 Separatrizes

Separatrizes (S) de uma série de n termos x1, x2, x3, ..., xn colocados em ordem
crescente (ou decrescente) de valor é o termo da série que a divide em duas ou mais
partes qualquer.

Exemplo 06:

A mediana é uma separatriz, como já foi dito, pois ela divide a série em duas partes
iguais.

As principais separatrizes são a mediana, os quartis, os decis e os percentis (ou


centis). Outras separatrizes poderiam ser deduzidas, porém estas são as mais usuais.
Uma separatriz genérica é chamada quantil.
Observação:

Os quartis, decis e percentis (ou centis) são separatrizes que dividem a série,
respectivamente, em quatro, dez e cem partes iguais.

Quartis:

UPE - Universidade de Pernambuco


São representados por Q1, Q 2 e Q 3 sendo chamados, respectivamente,
primeiro, segundo e terceiro quartil.
Onde:
? Primeiro quartil ( Q1) de uma série ordenada de modo crescente (ou
decrescente) é o termo da série que é precedido por 25% dos termos (n /4) e
seguido pelos restantes 75% (3n/4).
? Segundo quartil coincide com a mediana ( Q2 = M e), dividindo, portanto, a
série em duas partes iguais.
? Terceiro quartil (Q3) é o termo da série que é precedido por 75% (3n/4) dos termos
e seguido pelos restantes 25% (n/4).

Decis: 4

São representados por D1, D 2, D 3, ..., D 9 sendo chamados, respectivamente


91
primeiro, segundo, terceiro,..., nono decil.

NEED - Núcleo de Estudo em Educação a Distância


Onde:
? Primeiro decil ( D1) de uma série ordenad a de modo crescente (ou
decrescente) é o termo da série que é precedido por 10% do s termos (n/10) e
seguido pelos restantes 90% (9n/10).
? Segundo decil (D2) é precedido por 20% dos termos (2n/10) e seguido pelos
restantes 80% (8n/10).
? E assim sucessivamente até o nono decil.

Observação:

O quinto decil é igual à mediana (D5 = Me).


Percentis:

São representados por P1, P 2, P 3, ..., P 99 sendo chamados primeiro, segundo,


terceiro, .., nonagésimo nono percentil.
Onde:
? Primeiro percentil ( P1) de uma sér ie ordenada de modo crescente ( ou
decrescente) é o termo da série que é precedido por 1% dos termos (n/100) e
seguido pelos restantes 99%(99n/100)
? S egundo percentil ( P2) é precedido por 2% dos termos (2n/100) e seguido
pelos restantes 98% (98n/100)
UPE - Universidade de Pernambuco

? E assim sucessivamente até o nonagésimo percentil.

Responda: Qual o percentil que equivale à mediana numa série de dados numéricos?

Observando as definições dos quartis, decis, percentis e mediana, chegamos a:

Q1 ?
P25 Q2 ?
Me ?
D5 ?
P50 3 ?
75

4
D1 ?
P10 D2 ?
P20 D3 ?
P30 D4 ?
P40
92
D6 ?
P60 D7 ?
P70 D8 ?
P80 D9 ?
P90
NEED - Núcleo de Estudo em Educação a Distância

Observação:

Com exceção talvez para a mediana não é usual a utilização das demais separatrizes
(quartis, decis e percentis) para séries constituídas de dados isolados ou de dados
repetidos.

2.1.1 Cálculo das separatrizes para dados grupados em classes de freqüência.

Agora vamos ver como proceder para encontrar estas separatrizes, ou seja, os
quartis, decis ou percentis (centis), para, evidentemente, dados agrupados com
classes de freqüências. A fórmula geral de cálculo, semelhante à fórmula da mediana
e é escrita como sendo:
P?
? F ?
S? ?a ?
Li ? h
?F ?

Onde:

S ?
separatriz desejada (mediana, quartil, decil ou percentil);
Li ?
limite inferior da classe que contém a separatriz;
P ?
posição da separatriz
Fa ?
freqüência acumulada da classe vizinha anterior à classe que contém a separatriz;

UPE - Universidade de Pernambuco


F ?
freqüência da classe que contém a separatriz
h ?
amplitude da classe que contém a separatriz.

Observamos pela fórmula acima que nela interferem muitos dados da classe que
contém a separatriz. De modo semelhante ao utilizado para a mediana, localizamos
esta classe através da posição da separatriz e da coluna auxiliar de freqüência
acumulada, que iremos sempre acrescentar na tabela dada para uma melhor
visualização dos elementos desta expressão matemática.

2.1.1.1 Como determinar a posição P, de uma separatriz


4
Veremos agora como proceder para determinar o valor de P, posição de uma
separatriz, para cada uma das separatrizes explicitada anteriormente.
93

NEED - Núcleo de Estudo em Educação a Distância


[a] Para os quartis:

Primeiro quartil (Q1) ?P = n/4;


Segundo quartil (Q2) ?P = 2n/4;
Terceiro quartil (Q3) ?P = 3n/4.

Genericamente para um quartil de ordem i, vem:

n
Pi?
4

i = 1, 2 ou 3, conforme se trata, respectivamente, do primeiro, segundo ou terceiro


quartil.

[b] Para os decis:


Primeiro decil (D1) ? P = n/10
Segundo decil (D2) ? P = 2n/10
Terceiro decil (D3) ? P = 3n/10
Quarto decil (D4) ? P = 4n/10
Quinto decil (D5) ? P = 5n/10
.............................................................
.............................................................
Nono decil (D9) = 9n/10
UPE - Universidade de Pernambuco

Genericamente para um decil de ordem i, vem:

n
Pi?
10

i = 1, 2, 3,...,9 conforme se tratar, respectivamente, primeiro, segundo, .., nono decil.

[c] Para os percentis:

4 Primeiro percentil (P1) ? P = n/100


Segundo percentil (P2) ? P = 2n/100
94 Terceiro percentil (P3) ? P = 3n/100
......................................................................................
NEED - Núcleo de Estudo em Educação a Distância

......................................................................................
Nonagésimo nono percentil (P99) ? P = 99n/100

Genericamente para um percentil de ordem i, vem:

n
Pi?
100
i = 1, 2, 3, ..., 99 conforme se trata, respectivamente, do primeiro, segundo, terceiro,
..., nonagésimo nono percentil.

[d] Para a mediana (seja n, par ou ímpar), temos:

P = n/2
Para facilitar ainda mais os cálculo analítico de uma separatriz, apresentamos como
roteiro:

[i] Compor coluna auxiliar de freqüência acumulada (Fa)


[ii] Determinar a posição (P) da separatriz, usando uma das fórmulas:

n n n n
Pi? ; Pi?; Pi? ; P ?

UPE - Universidade de Pernambuco


4 10 100 2

no caso de calculamos, respectivamente, quartis, decis, percentis ou a mediana,

[iii] Com o auxílio dos itens anteriores, localizar a classe que contém a separatriz;
[iv] Usar a fórmula geral da separatriz S, observando que:

-não é recomendável usar aproximações numéricas para o valor da posição (P) da


separatriz; 4
-Quando a separatriz se situar na primeira classe, a freqüência acumulada da classe
anterior à mesma será nula, isto é, Fa = 0. 95

NEED - Núcleo de Estudo em Educação a Distância


Chama-se ordem percentílica (OP) o índice do percentil. É um número que indica o
percentual de elementos de uma série ordenada de modo crescente, que é inferi or
a separatriz correspondente. Assim por exemplo, se para uma distribuição de
ganhos horários encontramos Me = R$ 158,00/h; Q 3 = R$ 172,50/h; P 84 = R$
181,71 e D 7 = R$ 168,67/h, temos para essas separatrizes, ordens percentílicas,
respectivamente iguais a, 50, 75 , 84 e 70. Isto nos permite afirmar que:

? Q ue 50% dos empregados percebem salários inferiores (ou superiores) a


158,50/h;
? Q ue 75% dos empregados ganham menos R$ 172,50/h (ou que 25% deles
recebem mais que esse valor);
? Que 84% dos empregados recebem até R$ 181,71/h (ou que apenas 16% deles
percebem mais que essa quantia);
? Que 70% dos empregados ganham até R$ 168,67/h (ou que 30% dos empregados
recebem mais que R$ 168,67/h).
Exemplo 07:

Damos a seguinte distribuição de pesos (apenas as duas primeiras linhas: classes


pesos - e freqüências simples número de pessoas, fazem parte do problema. A outra
linha, de freqüência acumulada fora construída para solução do exercício).

Pesos (kg) 60 ? 66 66 ? 72 72 ? 78 78 ? 84 84 ? 90 TOTAL


Nº de Pessoas 120 180 80 40 20 440
(F)
UPE - Universidade de Pernambuco

Fa 120 300 380 420 440

Determinar
[a] a mediana e o primeiro quartil, indicando as respectivas ordens percentílicas e
significados;
[b] a separatrizes com o respectivo significado, cuja ordem percentílica é 74;
[c] o peso acima do qual temos 20% de pessoas com pesos superiores a ele;
[d] a ordem percentílica corresponde a 64,4 kg e o seu significado;

4 [e] determinar a faixas de ordens percentílicas e de peso, dividindo as pessoas em


classes de gordos (20% dos indivíduos mais pesados médios), (55% das pessoas com
96 peso abaixo dos gordos) e magros (25% das pessoas mais magras).
NEED - Núcleo de Estudo em Educação a Distância

Resolução

[a] Seguindo o roteiro para cálculo analítico de uma separatriz, vem:


Uma vez que, já compomos a linha auxiliar de freqüência acumulada (Fa)
correspondente à distribuição de peso, logo:

a.1 - posição (P) da mediana, usando a fórmula P = n/2 = 440/2 = 220.

Assim, a mediana será o peso correspondente ao 220° elemento da série ordenada;


vemos, assim, com o auxilio de Fa, que o termo cuja posição é 220° está localizada na
classe 66 ?72 (onde se situam desde o 121° elemento até o 330°);

Então:
P−
 F   220 −
120  600
S=  a
Li + h=
66 +
 6=
66 + =
69,3kg
F   180  180

Como se trata da mediana, que divide a série em duas partes, logo, a ordem
percentílica é de 50.

Conclusão: 50% das pessoas têm pesos inferiores (ou superiores) a 69,3kg.

UPE - Universidade de Pernambuco


a.2 – Primeiro quartil ?
Q 1 neste caso, P = n/4 (i = 1), daí P = 440/4 ?
P=
110.

Logo, olhando a linha de freqüência acumulada, este valor está na classe 60 ?


66.

Calculando:

P?
? F ? ? 110 ?
0 ? 660
S?
Q1 ? ?a ?
Li ? h?
60 ?
? ? 6?
60 ??65,5kg
?F ? ? 120 ? 120

Como se trata do primeiro quartil, logo a ordem percentílica é de 25. 4


97
Conclusão: temos 25% das pessoas pesando até 65,5kg, ou, dito de outra forma, 75%

NEED - Núcleo de Estudo em Educação a Distância


das pessoas têm pesos superiores a 65,5kg.

b) neste caso há separatrizes cuja ordem percentílica é 74 é o septuagésimo quarto


percentil, pois, o quartil e o decil não possuem esta ordem. Sendo assim.

440
OP = 74 ?
P74 onde P74 = 74x uma vez que i = 74 e n = 440 ?
P = 325,6
100
325,6 ?
? 300 ?
Este valor esta representado na classe 72 ?
78 onde S ?
P74 ?
72 ?
? 6
?
?80 ?

Resolvendo: P74 = 73,9kg ?


74% das pessoas pesam menos que 73,9kg.

[c] O peso acima do qual temos 20% de pessoas com pesos superiores a ele é o
mesmo abaixo do qual se situam 80% (100% - 20%) de indivíduos com pesos
inferiores, ou, em outras palavras, é a separatriz cuja ordem percentílica é 80 (oitavo
decil ou octagésimo percentil).
440
Assim sendo, basta calcularmos D8 onde D8 = 8x ? D8 = 352
10
?352 ?300 ?
Este valor corresponde a classe 72 ?
78 onde S ?D8 ?
P80 ?72 ?? 6
?
? 80 ?
Daí: D8 = P80 = 75,8kg

[d] Este item se refere ao problema inverso: dá-se a separatriz e procura-se a ordem
percentílica que lhe corresponde.
UPE - Universidade de Pernambuco

?P? F ?
Da fórmula geral S ? Li ??a ? h , conhecemos S ? 64,4 kg , que pertencendo
Pi ?
? F ?
a classe 60 ? 66, nos conduz a Li = 60; F = 120; F a ( freqüência acumulada da classe
anterior à primeira) e h = 6. Assim, vem:

P? 0 6P
64, 4 ?
60 ? ? 6; ?
64, 4 ?
60 eP ?
120 ?
4, 4 / 6 ?
88 (posição da separatriz).
120 120

Como pela fórmula, Pin


? /100 , temos: 88 ?
? i?
440 /100 ; i ?
100 ?
88 / 440 ?
20 ?
OP.

4 Assim, o significado é que 20% das pessoas pesam menos de 64,4 kg.

98
[e] Como as separatrizes necessárias à composição das faixas de pesos já foram
NEED - Núcleo de Estudo em Educação a Distância

determinadas nos itens anteriores, temos:

Faixas
Classificação
OP Pesos (kg)

A moda, norma, valor modal, é por definição, o valor xk da série que ocorre com a
maior freqüência, isto é, o valor mais comum.
Um conjunto de valores pode apresentar mais de uma moda. Neste caso, dizemos
ser plurimodal, caso contrário será unimodal, ou ainda, amodal (quando todos os
valores das variáveis em estudo apresentarem uma mesma freqüência).

3.1 - Cálculo da Moda

3.1.1 Caso: dados brutos ou rol

UPE - Universidade de Pernambuco


Basta identificar o elemento de maior freqüência.

Exemplo 08:

Determine a moda dos seguintes conjuntos de dados:


A = {1, 2, 3, 4, 5, 6}; B = {10; 10; 12; 13; 18}; C = {100, 100, 200, 200, 300, 600}

Solução:

4
O conjunto A não tem moda, é chamado de “conjunto amodal”.
O conjunto B tem uma moda Mo = 10, é também chamado de “conjunto unimodal”
O conjunto C tem Mo = 100 e Mo = 200, é chamada de “conjunto binmodal” ou
99
“plurimodal”

NEED - Núcleo de Estudo em Educação a Distância


3.1.2 Caso: variável discreta

Neste caso, as freqüências já estão computadas na segunda coluna. Basta identificar


o elemento de maior freqüência.

Exemplo 09:

xi Fi A maior freqüência observada na segunda coluna é 23


corresponde ao elemento 248 da série. Por tanto é uma
série unimodal com M o ?248
Exemplo 10:

xi A maior freqüência observada é 5 e corresponde aos valores


2 e 4. Portanto, é uma série bimodal com Mo = 2 e Mo = 4.
Fi

Exemplo 11:

xi Observe que todos os elementos da série possuem a


mesma freqüência. Portanto a série é amodal (não tem
UPE - Universidade de Pernambuco

Fi
moda).

3.1.3 Variável Contínua (dados agrupados em classe)

Neste caso, a moda não é percebida tão facilmente como nos casos anteriores, para
tal, utilizaremos dois processos na sua obtenção.

4 Antes do conhecimento desses dois processos vamos compreender que se chama de


Classe Modal, a classe no agrupamento que possui a mais alta freqüência.
100
NEED - Núcleo de Estudo em Educação a Distância

1° Processo: moda de Czuber

? ?
1
?
Mo ?
li ?
? ? ?
h
?
?1?
? 1?

Onde:

Mo ? Moda
?1 - freqüência da classe modal - freqüência da classe vizinha anterIor (?1 ?? Fmáx Fant )
?2 - freqüência da classe modal - freqüência da classe vizinha posterior (? 2 =Fmáx
?
Fpost )
h - amplitude do intervalo de classe
li - limite inferior da classe modal
Exemplo 12

Calcule a moda pelo processo de Czuber da distribuição abaixo.

Classe Freqüência

UPE - Universidade de Pernambuco


Solução:

A classe modal é a 3° classe, portanto, a moda vale:

?3 ?
?
1 ?
6?3; ?
3? 2 ?
6?4 ; Li = 20; h = 10 ?
2? Mo ?
20 ?
?? 10 ?
Mo = 24,3
3?
? 4?

Interpretação: 24,3 é o valor mais freqüente nesta distribuição.

2° Processo: moda de King Mo ?


li ?
[
Fpost
].h
4
Fant ?Fpost
101
Onde: li - limite inferior da classe modal

NEED - Núcleo de Estudo em Educação a Distância


Fpost - freqüência da classe posterior à classe modal
Fant - freqüência da classe anterior à classe modal
h - amplitude do intervalo de classe

Exemplo - 13

Calcule a moda pelo processo de King para a distribuição do exemplo - 12.

?2 ?
Li = 20; Fpost = 2; Fant = 3; h = 10 ?
Mo ?
20 ?
?? 10 ?
Mo = 24
3?
? 2?

Interpretação: 24 é o valor mais freqüente nesta distribuição


Tarefa 4.3
I - Abaixo temos a distribuição do número de acidentados por dia, durante 53 dias,
em certa rodovia:

N° de acidentados 0 1 2 3 4
N° dias 20 15 10 5 3

Pede-se:
UPE - Universidade de Pernambuco

a) Determinar a média;
b) Determinar a mediana;
c) Calcular a moda;
d) Qual a porcentagem de dias em que tivemos dois ou mais acidentes?

II - Na distribuição de salário abaixo descrita, determinar:


a) o salário modal;
b) o salário mediano;
4 c) o salário médio;
d) abaixo de que salário se situam os 30% mais mal remunerados?
102
e) acima de que salário se encontram os 15% mais bem remunerados?
NEED - Núcleo de Estudo em Educação a Distância

f) acima de que salário ficam os 20 operários mais bem pagos?

Salários (R$) N° de operários


600 |— 800 28
800 |— 1000 36
1000 |— 1200 58
1200 |— 1400 72
1400 |— 1600 43
1600 |— 1800 13
Referência Bibliográfica

AZEVEDO, Amílcar Gomes. Estatística Básica. 5 ed, Rio de Janeiro: LTC,


1987.
CRESPO, Antônio Arnot. Estatística Fácil. 17 ed. São Paulo: Saraiva,1999.
MARTINS, G. A, Donaires, D. Princípios de Estatística. 4 ed. São Paulo.
Atlas,1990.
MOREIRA, José dos Santos. Elementos de Estatísticas. 9 ed. São Paulo:
Atlas. 1975.
PEREIRA, Wilson. Estatística: Conceitos Básicos. 2 ed. São Pailo: MC
Graw Hill,1990.
SPIEGEL, MR. Estatística. 2 edição São Paulo: Mcgraw. Hill,1985.
TOLEDO, Geraldo Luciano. Estatística Básica. 2ª ed. São Paulo: Atlas,
1985.
VIEIRA, Sonia. Elementos de Estatística. 3ª ed. São Paulo: Atlas, 1999.
Medidas de Dispersão
-Intervalo (Amplitude Total)
-Desvio Médio Absoluto
-Variância Desvio Padrão FASCÍCULO

Carga Horária - 10 horas


Gilberto Pereira da Silva
Mário de Souza 5
Objetivos

Após terminar a leitura deste fascículo, o estudante deve estar em


condições de:

1. Definir o objetivo das medidas de dispersão.


2. Explicar o que são medidas de dispersão e como elas podem ser
usadas.
3. Identificar as vantagens e descrever as características importantes de cada
medida de dispersão

Introdução

As medidas de dispersão de uma distribuição são valores que indicam o grau de


afastamento dos valores da variável em relação à média.
UPE - Universidade de Pernambuco

Intervalo (amplitude total)

O intervalo de um grupo de números é de modo geral, a medida mais simples de


calcular e de entender. Focaliza o maior e o menor valor no conjunto (ou seja, os
valores extre- mos). O intervalo pode ser expresso de duas maneiras:

I) A diferença entre o maior e o menor valor (também cha- mada Amplitude Total);
II) O maior e o menor valor no grupo.
5
106 Consideremos estes três valores: 1, 10 e 25. A diferença entre o valor maior e o
menor é: 25 1 = 24. Alternativamente, pode se dizer que o intervalo de valores vai
NEED - Núcleo de Estudo em Educação a Distância

de 1 à 25.

A vantagem de utilizar o intervalo como medida de disper- são reside no fato de o


intervalo ser relativamente fácil de cal- cular, mesmo para um grande conjunto de
números. Igualmen- te, a significação de intervalo é fácil de entender.

A maior limitação de intervalo é o fato de ele só levar em conta os dois valores


extremos de um conjunto, nada informando quanto aos outros valores.

Exemplos:

1) A amplitude total (AT) da distribuição: 2, 3, 5, 9, 11, 15, 17, 22, 25 é: 25 -- 2 =


23
2) O intervalo (AT) da distribuição: 14, 3, 17, 4, 8, 73, 36, 48 é:
73 3 = 70.

3) O intervalo (AT) da distribuição: 3,2; 4,7; 5,6; 2,1; 1,9; 10,3; é: 10,3 1,9 = 8,4

Amplitude de um Intervalo de Classe

UPE - Universidade de Pernambuco


A amplitude de um intervalo de classe ou simplesmente, intervalo de classe é a
medida do intervalo que define a classe.

Ela é obtida pela diferença entre os limites superior e inferior dessa classe, e é
indicada por

hi . Assim: hi ? li , onde:
Li ?

Li limite superior da classe 5


li limite inferior da classe
107

NEED - Núcleo de Estudo em Educação a Distância


Exemplos:

Na distribuição da tabela (1) abaixo:

Tabela.1

i ESTATURAS (cm) FREQUÊNCIA

1 150 ?
154 4
2 154 ?
158 9
3 158 ?
162 11
4 162 ?
166 8
5 166 ?
170 5
6 170 ?
174 3
?
?40
Temos: h1 ?154 ?150 ?h1 ?4cm
h7 ?174 ?170 ?h7 ?4cm

Amplitude Total da Distribuição

Amplitude total da distribuição (AT) é a diferença entre o limite superior da última


classe (limite superior máximo) e o limite inferior da primeira classe (limite inferior
UPE - Universidade de Pernambuco

mínimo)

AT ?
L( máx ) ?
l ( mín )

Exemplo:

Na distribuição anterior (tabela.1) temos:


5
AT ?
174 ?
150 ?
24 ?
AT ?
24cm
108
NEED - Núcleo de Estudo em Educação a Distância

Amplitude Amostral

Amplitude amostral (AA) é a diferença entre o valor máximo e o valor mínimo da


amostra

AA ?
x( máx ) ?
x( mín )

Exemplo:

Na distribuição da amostra:

166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
Temos: AA ?
173 ?
150 ?
23 ?
AA ?
23

Desvio Médio Absoluto (DMA)

O desvio médio absoluto (DMA) de uma distribuição é a média aritmética dos


módulos dos desvios (diferença entre o valor da variável e a média).

UPE - Universidade de Pernambuco


O desvio médio absoluto mede o desvio médio dos valores em relação à média do
grupo, ignorando o sinal do desvio.

Calcula-se o DMA subtraindo a média de cada valor do grupo e desprezando o sinal


(+ ou --) do desvio, e tomando a média em seguida.

Dada à distribuição: x1, x2, x3, ... xn , os desvios são: x1 ?


x ; x2 ?
x ; x3 ?
x;
... x n ?
x , e o desvio médio é:
n

x1 ?
x ?
x2 ? ?
x ??xn ?
x ? xi ?
x 5
i?
1
Dm ? ou Dm ? , onde n é o número de
n n
109
observações do conjnto.

NEED - Núcleo de Estudo em Educação a Distância


Obsercação:

Para o cálculo do desvio médio são tomados os módulos dos desvios, pois a
soma dos desvios é zero.

Exemplos:

1) Calcular o desvio médio da distribuição: 7, 10, 12, 15, 16, 18, 20.

Resolução:

Primeiramente devemos calcular a média aritmética dos dados:


7?
10 ?
12 ?
15 ?
16 ?
18 ?
20 98
?? 14 . Portanto,
7 7

7?
14 ?
10 ?
14 ?
12 ?
14 ?
15 ?14 ?
16 ?
14 ?
18 ?
14 ?
20 ?
14
Dm ?
7

7?
4?
2?
1?2?
4?
6 26
? ?? 3,42
7 7
UPE - Universidade de Pernambuco

2) Determine o desvio médio para o seguinte conjunto de números: 2, 4, 6, 8, 10.

Resolução:

2?
4?
6?8?
10
X ? ?
6
i. Determinemos a média: 5

ii. Determinemos a diferença entre cada valor e a média:

xi ?
x
5 2 -- 6 = -- 4
4 – 6 = -- 2
110 6–6 = 0
8–6 = 2
NEED - Núcleo de Estudo em Educação a Distância

10 – 6 = 4

Tomemos os valores absolutos dessas diferenças e soma- mos:

xi ?
x 12
4?
2?
0?
2?
4? ?
12 ?xi ?
x . Logo; Dm ?
n
?
5
?
2,4

3) Determine o desvio médio para o conjunto de valores: 1, 2, 3, 4, e 5.

Resolução:

1?
2? 3? 4?
5 15
X ? ? ?3
5 5
?xi ? x 1?
?
3? 2? 3?
3? 3?
4?
3?
5?
3 2?
?
1?
0?1?
2 6
? ?
1,2
n 5 5 5
Variância

O fato de conhecermos a média de uma distribuição de probabilidade já nos ajuda


bastante, porém não temos uma medida que nos dê o grau de dispersão de
probabilidade em torno dessa média.

A variância de uma distribuição é a média aritmética dos quadrados dos desvios. A


variância de uma amostra é represen- tada por S 2 e constitui uma estimativa da
2
variância da popula- ção que é representada por ? (sigma ao quadrado).

UPE - Universidade de Pernambuco


A variância é uma medida que dá o grau de dispersão (ou de concentração) de
probabilidade em torno da média.

Assim, se x1 , x 2 , x3 ,?
xn , é uma amostra de n elementos da variável xi , então:

n
2
?
(x ?
x)i
S2 ?
i?
1

n
e para dados tabulados a variância é dada por: 5
n 111
∑ x)2. fi
( xi −

NEED - Núcleo de Estudo em Educação a Distância


S2 =
i=
1
Onde: xi =
média da classe e f i = freqüência da classe.
n−1

Observações:

25) devemos tomar o deno - minador de S 2 como


Para valores pequenos de n (n ?
n? 1 em lugar de n .
n
2
?
(x ?
x) .
i
Assim, para amostras pequenas temos: S 2 ?
i?
1

n?
1

O processo, para calcular a variância amostral, é o seguinte:


1. Calcular a média da amostra.
2. Subtrair a média de cada valor da amostra.
3. Elevar ao quadrado cada uma das diferenças.
4. Somar esses quadrados.
5. Dividir por n −
1.

Exemplos:
UPE - Universidade de Pernambuco

1) Determinar a variância da amostra, constituída dos seguintes elementos: 7, 10, 12,


15, 16, 18 e 20.

Resolução:

5
112
n

i?
1
?
x
7?
i
10 ?
12 ?
15 ?
16 ?
18 ?
20 98
x? ? ? ?
14
NEED - Núcleo de Estudo em Educação a Distância

n 7 7

14) 2 ?
(7 ? 14) 2 ?
(10 ? 14) 2 ?
(12 ? 14) 2 ?
(15 ? 14) 2 ?
(16 ? 14) 2 ?
(18 ? 14) 2
(20 ?
S2 ?
7?1

7) 2 ?
(? 4) 2 ?
(? 2) 2 ?
(? 12 ?
22 ?
42 ?
6 2 126
= ?? 21
6 6

3
2) Ao se cultivar o peixe tambaqui, a 60ind/m / 120 dias, criados em gaiolas de
1,0 m3, obtiveram-se os seguintes pesos (g):

Gaiola/1 Gaiola/2

350,3 342,3 352,8 345,9 340,7 350,1 350,1 331,7 334,1 350,9
328,4 345,8 334,1 360,6 356,6 349,9 348,7 345,1 348,0 348,9

X ?
345,75 g
X?
345,75 g
Observe que as médias dos pesos dos peixes das gaiolas 1 e 2 são iguais,
evidenciando que apenas a média não é suficiente para diferenciar qual dos dois
cultivos gerou peixes de melhor ou pior crescimento em peso. Dessa forma, faz-se
necessário conhecer a variância, para um melhor diagnóstico.

Calculando a variância, temos:

UPE - Universidade de Pernambuco


Gaiola/1

345,75) 2 +
(350,3 − 345,75) 2 +
(342,3 − 345,75) 2 +
(352,8 − L+ 345,75) 2
(356,6 −
=
98,09 g
10 −1

Gaiola/2

345,75) 2 ?
(350,1 ? 345,75) 2 ?
(350,1 ? 345,75) 2 ?
(331,7 ? ?? 345,75) 2
(348,9 ?
?
48,76 g 5
10 ?1
113
Como a variância da gaiola 2 foi menor do que a da gaiola 1, pode-se concluir que o

NEED - Núcleo de Estudo em Educação a Distância


crescimento dos peixes da gaiola 2 foi mais uniforme.

3) Determinar a variância da amostra constituída dos seguin- tes elementos: 7, 10,


12, 15, 16, 18, 20.

Resolução:

7?
10 ?
12 ?
15 ?
16 ?
18 ?
20 98
X ? ?? 14
7 7
xi ( xi ?
x) x)2
( xi ?
7 --7 49
10 --4 16
12 --2 4
15 1 1
16 2 4
18 4 16
20 6 36
2
?
(x ?
x) ?
126i
UPE - Universidade de Pernambuco

n
2
?
(x ?
x) .
126 i

Portanto, S2 ?
i?
1
S 2 ??
? 21
n?
1 6

4) Calcule a variância da amostra 2, 4, 6, 8, 10

Resolução:
5
114 2?
X ?
4?
6?8?
10 30
?? 6
5 5
NEED - Núcleo de Estudo em Educação a Distância

xi ( xi ?
x) x)2
( xi ?
2 --4 16
4 --2 4
6 0 0
8 2 4
10 4 16
2
?
(x ?
x) ?
40i

n
2
?
(x ?
x) . i
40
Logo; S2 ?
i?
1
S 2 ??
? 10
n?
1 4
5) Determine a variância dos dados: 1, 3, 4, 3, 4, 2, 4, 1, 2, 2, 1, 0

Resolução:

1?
3?
4?
3?
4?
2? 4?
1?
2?
2?
1?
0 27
X ? ?? 2,25
12 12

UPE - Universidade de Pernambuco


xi ( xi ?
x) x)2
( xi ?
1 -1,25 1,5625
3 0,75 0,5625
4 1,75 3,0625
3 0,75 0,5625
4 1,75 3,0625
2 -0,25 0,0625
4 1,75 3,0625
1 -1,25 1,5625
2 -0,25 0,0625
2 -0,25 0,0625
1 -1,25 1,5625
0 -2,25 5,0625

?
(x ?
x) ? 2
20,25
i
5
115

NEED - Núcleo de Estudo em Educação a Distância


n
2
?
(x ?
x) .i
20,25
Portanto, S2 ?
i?
1
S2 ? ?
? S2 ?
1,84
n?
1 11

Desvio Padrão

O desvio padrão de uma distribuição é a raiz quadrada da variância.

O desvio padrão da amostra é representado por S .

Desta forma, se x1 , x 2 , x3 ,?
xn é uma amostra de n elementos da variável xi , então o
?? x?
x ? i
2

desvio padrão é S? .
n?
1
Exemplos:

1) Calcule o desvio padrão da amostra: 20, 5, 10, 15, 25.

Resolução:

20 ?
5?
10 ?
15 ?
25 75
X ? ?? 15
5 5
UPE - Universidade de Pernambuco

xi ( xi ?
x) x)2
( xi ?
20 5 25
5 -10 100
10 -5 25
15 0 0
25 10 100
2
?
(x ?
ix) ?
250

?? x?
x ? 250i
2

Portanto, S ? ? ? 62,5 ?
7,91
5 n?
1 4

116 2) Sendo a variância de uma amostra igual a 81, calcule o desvio padrão dessa
amostra.
NEED - Núcleo de Estudo em Educação a Distância

Resolução:

Como o desvio padrão é a raiz quadrada da variância, temos: S ?81 ?


S?
9

O desvio padrão é uma das medidas mais comumente usadas para distribuições, e
desempenha papel relevante em toda a estatística.

Cabe notar que a unidade do desvio padrão é a mesma da média. Por exemplo, se a
média é em dólar, o desvio padrão também é em dólar.

Exercícios:

1) As estaturas de uma amostra de 40 alunos de um colégio foram:


166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161

Sendo a distribuição de freqüência:

i ESTATURAS (cm) FREQUÊNCIA

UPE - Universidade de Pernambuco


1 150 ?
154 4
2 154 ?
158 9
3 158 ?
162 11
4 162 ?
166 8
5 166 ?
170 5
6 170 ?
174 3

?
?40

Responda:
5
a. Qual a amplitude amostral? 117
b. Qual a amplitude de distribuição?

NEED - Núcleo de Estudo em Educação a Distância


c. Qual o número de classes da distribuição?
d. Qual o limite inferior da quarta classe?
e. Qual amplitude do segundo intervalo de classe?

2) Determine o intervalo dos seguintes conjuntos de dados:


8.100; 9.000; 4.580; 5.600; 7.680; 4.800; 10.640

3) Calcule o desvio-padrão dos seguintes dados:


2,1; 2,5; 2,7; 2,3; 2,4; 2,0; 2,7; 3,0; 1,4; 2,4; 2,8

4) Considerando os seguintes dados correspondentes a preços de propostas:


26,5; 27,5; 25,5; 26,0; 27,0; 23,4; 25,1; 26,2; 26,8
a. Calcule o intervalo
b. Determine o Desvio Médio Absoluto
c. Determine a variância
d. Determine o desvio-padrão

5) Dada a distribuição abaixo:


5 10 9 1 10 10 8 7 7 3 8 0 9 8 2.
UPE - Universidade de Pernambuco

Pede-se:
a. Calcular o desvio médio absoluto;
b. Calcular a variância;
c. Calcular o desvio-padrão.

6) Dada a distribuição abaixo:


3 8 4 4 3 3 4 5 4 0 7 5 6 5 3.
5
118 Pede-se:
NEED - Núcleo de Estudo em Educação a Distância

a. Calcular o desvio médio absoluto;


b. Calcular a variância;
c. Calcular o desvio-padrão.

7) Considerando os seguintes dados relativos ao número de ca-acidentes diários


num grande estacionamento, durante um período de 20 dias:

6 9 2 7 0 8 2 5 4 1
5 4 1 4 4 2 5 6 3 7

Pede-se:

a. Calcular o desvio médio absoluto;


b. Calcular a amplitude amostral;
c. Calcular a variância;
d. Calcular o desvio padrão;

8) O desvio padrão pode ser zero? Explique. Pode ser negativo? Explique.

UPE - Universidade de Pernambuco


5
119

NEED - Núcleo de Estudo em Educação a Distância


Referência Bibliográfica

Bibliografia (Básica):

1. Iezzi Gelson et al. Fundamentos de Matemática Elementar. Vol 11.


São Paulo: Atual.
2. MEYER, Paul L. Probabilidade: Aplicações à Estatística. Livros
Técnicos e Científicos. Rio de Janeiro: Editora S.A, 1983.
3. SPIEGEL, M. R. Estatística. 3. ed. São Paulo: Makron Books do Brasil,
1993. 643p.
4. WILLIAM J. Stevenson. Estatística Aplicada à Administração. Editora
Harbra Ltda.
1. COSTA Neto, P.L. Estatística. 15 ed. São Paulo: Edgard Blucher. 1977,
262p
2. GOMES, F.P. Curso de estatística experimental. Piracicaba: NOBEL,
1982. 469P.
Bibliografia (Complementar):
3. LEVIN, J. Estatística aplicada a ciências humanas. 2. ed. São Paulo:
Harbra, 1987. 392p.
4. MARTINS, G. de A. DONAIRE, D. Princípios de estatística. 4.ed. São Paulo: Atlas,
1990. 255p.
5. MORETTIN, L. G. Estatística Básica. 7. ed. Makron Books do Brasil. Editora Ltda.
6. SPIEGEL, M. R. Probabilidades e Estatística. Coleção SCHAUM. Editora
Santuário. Aparecida-SP.

Você também pode gostar