Bio e Statistic A
Bio e Statistic A
Bio e Statistic A
Reitor
Prof. Emanuel Dias de Oliveira e Silva
Vice-Reitor
Prof. Armando Carneiro Pereira do Rêgo Filho
Pró-Reitor Administrativo
Prof. Glêdeston Emerenciano de Melo
Pró-Reitor de Planejamento
Prof. Béda Barkokébas Jr.
Pró-Reitor de Graduação
Prof. José Guido Corrêa de Araújo
Coordenador Geral
Prof. Renato Medeiros de Morais
Coordenação Padagógica
Profª Rute Cândida Pereira
Profª Maria Vitória Ribas de Oliveira Lima
Profª Aidy Araújo Guedes
Profª Nara Carneiro Lacerda
Arte Final
Rinaldo Afonso de Lemos
Romeu Santos Jr.
Introdução
Quando você vai comprar, por exemplo, um aparelho de televisão, você antes de
comprar faz, em princípio, algumas perguntas, tais como: “Por que quero comprar
um aparelho de televisão? Que marca devo comprar? Qual o tempo de utilização
desse aparelho com esta ou aquela marca de interesse, sem que ele vá ao reparo? De
quantas polegadas eu quero este aparelho de televisão? Posso comprar a vista ou a
1 prazo? Se for a prazo, qual o melhor investimento que devo fazer?”, e assim por
diante. Às vezes até se consultam outras pessoas sobre o referido aparelho de
04 escolha ou um especialista sobre consertos de televisão.
NEED - Núcleo de Estudo em Educação a Distância
Quando você está fazendo isto ou algo parecido, você está levantando dados para
tomar uma decisão. Mas, antes de você tomar a decisão, você sempre faz uma análise
das informações obtidas durante o teu processo de solução do problema central:
comprar um aparelho de televisão. Vale salientar que outras variáveis podem ocorrer
neste processo de escolha.
Exercício 1.1
Assim sendo, aqui temos um problema: identificar as variáveis. E, estes dados que
poderão ser obtidos (identificados), junto às amostras que estou a consultar. Ou seja,
entendo estas identificações de variáveis e levantamento de dados como um
problema de estatística.
Assim, podemos compreender o trabalho estatístico como sendo um processo de
“pesquisa estatística, que envolve amostras, levantamentos de dados e análise das
informações obtidas” (PCN+EM, 2002, p. 126). Embora estejamos a trabalhar um
exemplo muito singular, fazemos salientar que ele serve de alicerce para a
compreensão do significado do trabalho estatístico, dentro (também) de um
processo histórico.
Sendo assim, ao dar início ao estudo da estatística, você está se deparando com uma
1
das parcelas do conhecimento humano, hoje dotado de um processo de
UPE - Universidade de Pernambuco
Sendo a escrita uma das maiores invenções humanas, podemos pensar, então, que
os registros dessa habilidade humana conduziram o homem a informar e comunicar
através da grafia. E, no início dessas grafias, as amostras da representação social e
cultural de um povo se sobressaíram, como expressão de uma sociedade.
Para se ter uma idéia desse fato, basta ver como essas grafias representadas em
pedras, ossos, madeiras, dentre outras formas de suporte físico para materializar um
símbolo (código), se formaram ao longo do tempo em escritas (antes conhecida
como mitografia, pois serviam a uma comunicação imediata através da pictografia)
sintética e ideográfica.
1- Como este é um trabalho cuja referência é educacional, faz-se necessário saber fazer a distinção entre conhecimento e saber. “Enquanto
o saber está relacionado ao plano histórico da produção de uma área disciplinar, o conhecimento é considerado mais próximo do
fenômeno da cognição, estando submetido ao vínculo da dimensão pessoal do sujeito empenhado na compreensão de um saber” (PAIS,
2001, p. 36).
uma idéia, fato que se concebe hoje como formas de linguagens. Desse modo, pode-
se compreender a estatística como uma ciência milenar, uma vez que expressões
gráficas, decifradas ao longo da história da humanidade, nos informaram a respeito
de trabalhos baseados em coletas de dados, como “podemos mencionar os dados
estatísticos gravados em monumentos egípcios que permitem avaliar as condições
econômicas do Estado e os movimentos das populações e os encontrados nas
bibliotecas de Assurbanipal, que informam sobre a hierarquia dos funcionários
públicos e sobre a população das províncias do Império Assírio” (MILONE &
ANGELINI, 1993, p. 22), isto cerca de 3000 anos a.C.
Exercício 1.2
Como a estatística lida com problemas da vida real, logo se sabe que a complexidade
desses problemas dentro de um contexto de interesse necessita ser trabalhada
dentro de uma perspectiva de tornar o ato complexo do contexto de interesse numa
versão simplificada, através de um modelo matemático. O fato interessante é que
esse modelo matemático-estatístico deve levar em conta a maior parte dos detalhes
de interesse do contexto ou da situação pesquisada na qual o problema está inserido.
1
No processo de aprendizagem dessa disciplina, você irá se familiarizar com a
08 variedade dos modelos estatísticos (ou modelos matemáticos). Só como exemplo, a
descrição de gráficos e tabelas com dados numéricos referem-se aos modelos da
NEED - Núcleo de Estudo em Educação a Distância
Assim, pode-se dizer que o ato de modelagem matemática é “um processo artístico,
visto que, para se elaborar um modelo, além do conhecimento de matemática, o
modelador precisa ter uma dose significativa de intuição e criatividade para
interpretar o contexto” (BIEMBENGUT & HEIN, 2000, p. 12). Além disso, podemos
compreender “que cada tipo de modelo é sempre incompleto, de alguma forma, pois
se refere, apenas, à parte do problema” (STEVENSON, 1981, p. 5), ou seja, uma parte
3
da complexidade . Isso nos faz ver que os problemas da vida real e a matemática são
conjuntos diferentes. Logo, a modelização é um processo de formação de uma
linguagem que possivelmente forneça uma representação do contexto, ou seja,
forme um conceito para nos possibilitar que seja estabelecida uma linguagem com o
mundo real, embora de forma complexa (que é diferente de complexidade). Temos
assim:
3 - “A complexidade não é complicação. O que é complicado pode reduzir-se a um princípio simples, mas a complexidade encontra-se
própria base” segundo Morin, Ciurama & Motta, 2003, pp. 44-5).
MODELAGEM MATEMÁTICA
MODELO
a) Interação
-Reconhecimento da situação-problema;
-Familiarização com o assunto a ser modelado (referencial teórico).
1
b) Matematização
-Formulação do problema (hipótese);
09
c) Modelo Matemático
-Interpretação da solução;
-Validação do modelo (avaliação).
Situação Problema
5 - Apresentação simplificada, do texto original (apresentado no livro), feita por Gerson Henrique da Silva.
esquema contém, como parte de sua especificação, a rede de intercorrelações que se
acredita estar normalmente entre os constituintes do conceito em questão”
(RUMELHART, 1980: 33-34. Apud NÖTH, 1998).
Logo, podemos definir modelo como sendo “uma versão simplificada de algum
problema ou situação da vida real destinado a ilustrar certos aspectos do problema,
4
sem levar em conta todos os detalhes” (STEVENSON, 1981, p. 5) , ou seja, é um
trabalho complexo retirado de uma complexidade maior, que é a vida real, ou seja,
UPE - Universidade de Pernambuco
Ainda, acerca dos modelos, podemos dizer que (op. cit. p. 5):
a) Utilidades
-Servem para comunicar uma idéia ou conceito.
10
c) Quanto ao seu envolvimento
NEED - Núcleo de Estudo em Educação a Distância
d) Características
-Servem para testar idéias antes de implementá-las;
-Servem para quantificar e formalizar o que se conhece da situação-problema.
Esses aspectos, aqui apresentados, sugerem você pensar numa compreensão maior
da idealização de modelos, que transcorreu em sua vida acadêmica na escola de nível
Fundamental e Médio. Por exemplo, em Geografia o Globo Terrestre é um modelo da
Terra. Os manequins são modelos de pessoas. Assim, ao fazer uso de bolinhas numa
determinada urna, posso compreender como sendo um modelo de determinados
elementos contidos num recipiente ou numa área. Por exemplo, o número de
bactérias (bolinhas) contidas na boca de um ser vivo (urnas). Só que, nesse último
caso, há necessidade de outros elementos para justificar o processo de medição.
Mas, sua apresentação serve, apenas, para ilustrar a importância da modelização em
matemática, e aqui, especificamente, para a estatística.
Exercícios 1.3
6
Estatística é uma atividade científica relacionada à obtenção de informações, a partir
de um corte na complexidade da realidade, com a busca experimental partindo das
coletas de dados, para que, com estas informações, seja possível criar um modelo
matemático (estatístico), com a finalidade de efetuar inferências a respeito da
população, como forma de comunicar o resultado esperado (ou não), a partir dos
dados coletados.
5 - Aqui o termo natureza vai além da concepção dos elementos de convívio real (no sentido de estar ligado aos cinco sentidos humanos),
indo, também, para o mundo do invisível e das relações compreendidas e elaboradas no mundo da cognição.
6 - A construção desse conceito fora adaptada a partir do conceito de estatística apresentado por Mendenhall, no livro Probabilidade e
Estatística, da Editora Campus, 1985, na página 17.
7 - Adaptados do texto de Stevenson, no livro Estatística Aplicada à Administração, da Editora Harbra, de 1981, na p.2.
Com essa definição de estatística, podemos agora compreender o significado de
bioestatística, uma estatística voltada para as análises dos aspectos que envolvem
vida. Assim, o ambiente de pesquisa está voltado para a área de saúde juntamente
com as profissões que envolvem as ciências biológicas.
Os Ramos da Estatística7
A descrição dos ramos da estatística serve de base para você melhor se situar no
UPE - Universidade de Pernambuco
contexto de seu trabalho estatístico, numa análise de dados que podem estar em suas
mãos, ou seja, você se apropriando de uma linguagem específica da estatística.
Estatística Descritiva
É a parte da estatística que utiliza os números para descrever os fatos. Em geral, esses
dados coletados são apresentados em forma de tabelas e/ou gráficos (histogramas).
1 Probabilidade
Inferência
É a parte da estatística que diz respeito à análise e interpretação dos dados amostrais.
Necessita de conceitos e métodos estatísticos, para entender o que está ocorrendo
com a amostra, tendo como premissa básica a ocorrência aleatória da amostragem.
Como toda ciência, a estatística tem sua linguagem própria. E esta linguagem deve
ser absorvida pelo estudante como forma de melhor trabalhar a compreensão e as
habilidades necessárias ao desenvolvimento da aprendizagem dessa disciplina. Para
isso, vamos compreender os conceitos de população e amostra (MENDENHALL,
1985, pp. 14-5).
População
Vejamos um outro exemplo para melhor entender este fato. Durante a campanha 1
para a presidência da República do Brasil, em 2002, as empresas de pesquisa
informavam e mostravam os gráficos de tendências de desempenho de cada 13
candidato. Como o resultado tinha uma relevância nacional, podia-se pensar que os
Além desses dois conceitos, existem outros que você deve compreender. Vejamos:
Variável
Tipos de variáveis:
Observações:
Além desses tipos, pode-se também descrever um tipo interessante que é aquele que
apresenta por si mesmo, apenas, dois resultados. É o tipo dicotômico. Este é um tipo
de variável que apresenta, apenas, duas categorias. Pode ser nominal ou ordinal.
Exemplos: (a) sexo masculino ou sexo feminino; (b) hipertensão arterial: presente ou
ausente.
Unidade de Observação
Amostragem aleatória
Experimentos aleatórios
São experimentos que podem ser repetidos em iguais condições, porém o resultado
que vai ocorrer não é um resultado esperado, com certeza.
Exemplo:
Em Recife 3% das pessoas têm a patologia Esclerose Múltipla. Selecionar mil pessoas
e verificar qual delas é portadora dessa patologia.
Conclusão/Orientação ao Estudante
Prezado estudante, esse texto é o seu primeiro contato com a disciplina bioestatística
e, sendo assim, você deve desempenhar um papel importante no ato de leitura e
compreensão. Para tal, vamos esboçar para você alguns passos que você deve
exercitar nessa sua leitura e compreensão do texto. Vejamos:
PRIMEIRO: Você deve fazer uma leitura geral de todo o texto sem a preocupação
de compreendê-lo como um todo.
Esses passos não formam uma receita de bolo, você deve descobrir o seu próprio
método (ou métodos) de aprendizagem. Se já possui, exercite-o (ou exercite-os).
Mas um fato interessante é que você, além de estar compreendendo a disciplina, está
também se profissionalizando na área de educação. Por isso, a necessidade de
compreensão de suas disciplinas no curso, inclusive da bioestatística, serão de suma
importância para o exercício de sua profissão, em que o conhecimento e a
aprendizagem que você tem da disciplina, em sua atuação como professor(a), deve
ser, em princípio, uma habilidade.
SEXATA: Uma pesquisa médica visa obter uma estimativa do tempo de vida de
um paciente, após este ter sido ser acometido de um tipo específico de câncer e após
ser submetido a um regime particular de radioterapia. Identifique a população que
interessa. É possível perceber algum problema para essa amostrar essa população?
UPE - Universidade de Pernambuco
Leituras Recomendadas
Nesse primeiro momento, o interessante é que você dedique-se a esse texto. Poderá
consultar texto na Internet (ver os sites indicados na orientação do aluno item
quinto). E junto a isso, proceda a uma leitura no capítulo primeiro do livro [5] na
referência bibliográfica deste texto.
18 Tome uma moeda, de dez centavos, por exemplo, coloque-a sobre uma mesa de sua
casa. E responda a seguinte questão? Quando eu empurrar esta moeda até ao chão,
NEED - Núcleo de Estudo em Educação a Distância
na vigésima vez ela dará cara? (repita o experimento sempre da mesma maneira).
Anote cada resultado que você encontrar, desde a primeira até a vigésima vez que
você empurrou a moeda para o chão. Responda agora: o número de caras que você
obteve foi igual ao número de caras? E o seu resultado esperado coincidiu?
Após esta prática você deverá perceber que o resultado esperado, de ½ para a cara ou
coroa só começa aparecer quando temos uma enorme quantidade de dados relativos
a estes resultados. Este fato deve ser compartilhado com outros colegas de outros
pólos diferentes do seu para agrupar mais dados e observar a possibilidade desse
resultado com mais realidade. Isto vai ser útil a você na compreensão do conceito de
probabilidade.
Referência Bibliográfica
Bibliografia Comentada
[3] D'AMBROSIO, Ubiratan. Etnomatemática. 4ª Edição. São Paulo, SP; Ática, 1998,
88p.
Este livro está dedicado ao contexto cultural, e portanto, isso nos reporta às
linguagens. Embora esse contexto seja muito amplo, o autor tomou o livro como uma
necessidade de se repensar o ensino da matemática. Ou seja, a produção
cultural/científica da matemática é um produto social e, conseqüentemente,
histórico. Esses fatos conduzem a uma análise crítica da geração e produção do
conhecimento, da sua institucionalização e da sua transmissão. Para você enquanto
estudante de um curso de profissionalização na área de educação, fazemos saber que
uma leitura no capítulo 5, deste livro, interessa a você. O uso dessa referência neste
texto fora apenas para dar uma visão sobre a origem do termo matemática.
[7] MILONE, Giuseppe & ANGELINI, Flávio. Estatística Geral. Vol. I. São Paulo, SP;
Atlas, 1983, 206p.
É um livro antigo, contendo um capítulo sobre a história da estatística que se destaca
como importante, no momento. Deve ser consultado, se houver interesse e tempo
do aluno, sobre este capítulo. Não é de relevância para os objetivos do curso e desse
texto.
[8] MORIN, Edgar; CIURANA, Emílio-Roger & MOTTA, Raúl. Educar na Era
Planetária: o pensamento complexo como método de aprendizagem no erro e na
incerteza humana. (Tradução de Sandra Trabucco). São Paulo, SP; Cortez, Brasília,
DF: UNESCO, 2003, 111p.
Este é um livro que você deve ter em sua biblioteca pessoal, não somente para esse
momento, mas para você começar a pensar a Educação Científica. Sua citação nesse
texto fora para mostrar a diferença entre complexo e complexidade, muito bem
exposto pelos autores.
[9] NÖRT, W. Panorama da Semiótica: de Platão a Pierce. São Paulo, SP: Annablume,
1995, Coleção E, 159p.
Este livro oferece ao leitor uma oportunidade ímpar, de compreender o significado da
semiótica para uma formação científica. Deve ser ele, numa oportunidade futura uma
leitura importante para o estudante em formação de licenciatura.
[10] PAIS, Luiz Carlos. Didática da Matemática: uma análise da influência francesa.
Belo Horizonte, BH; Autêntica, 2001, 125p.
A introdução desse livro na bibliografia teve o objetivo de fazer uma distinção entre
conhecimento e saberes, pois em educação faz-se necessário conhecer essa
diferença para uma melhor performance de sua atuação como professor(a). Se
houver interesse de o estudante querer conhecer sobre: transposição didática;
criações didáticas; epistemologia do professor; obstáculos epistemológicos e
didáticos; os conceitos e as definições; complexidade do conceito e engenharia
didática. Este livro é um bom referencial para sua formação profissional, embora
esteja formatado para a disciplina matemática.
[11] PERRENOUD, P. et. al. As competências para Ensinar no Século XXI: A formação
dos profissionais e o desafio da avaliação. Rio Grande do Sul, RS, Porto Alegre:
ARTMED, 2002, 176p.
Este livro é indicado para o profissional da educação, e apresenta as ênfases de um
trabalho na escola do século XXI. Deve ser lido numa oportunidade futura pelos
estudantes de licenciatura.
[13] ZAR, Jerrold H. Biostatistical Analysis. 4ª Edição. USA, Pretece-Hill, 1999, 663p.
Este é um livro específico para a bioestatística, muito bem estruturado, embora
seqüencial, mas com o diferencial de que está escrito na língua inglesa. Mas, se o
estudante ler em inglês, este livro é uma referência para todo o seu curso de
bioestatística.
Introdução à Bioestatística FASCÍCULO
Introdução
de gráficos a partir dos dados coletados. Nesse momento, temos dois fatos
interessantes: primeiro, o processo de contagem desses dados coletados e, segundo,
o gráfico a ser construído.
Esses dois fatos vêm da característica ímpar da estatística que busca a análise e a
interpretação dos dados como forma de viabilizar uma possibilidade de conclusão
baseada nas coletas de dados junto à análise gráfica, ou seja, numa linguagem visual.
Isso advém do processo das investigações sistêmicas que, organizadas desse modo,
têm a vantagem de apresentar um maior número de informações que podem ser
2 retiradas (compreendidas) de dentro do contexto da tabulação e/ou do gráfico, ou
seja, no contexto da análise estatística.
24
Sendo assim, há uma necessidade de compreender como se constroem as
NEED - Núcleo de Estudo em Educação a Distância
Nesse espectro, temos que compreender que o processo analítico inclui a análise de
informação qualitativa e quantitativa, na qual, essas informações estão contidas nos
tipos de variáveis, já estudadas no fascículo anterior. Isso caracteriza a idealização de
informação, para este estudo, repito, como uma capacidade de leitura e
interpretação que se faz diante do gráfico ou da tabela em processo de análise.
[a] discreta, na qual os atributos não estão numa ordem, mas dentro de uma faixa de
valores encontrados discretamente. Exemplo, o número de bactéria x em um volume
de urina, encontrada numa pessoa, nos meses de março, maio e julho, após esta
pessoa ter sido infectada no mês de março, e submetida a um tratamento. Esses são
dados discretos obtidos para cada um dos meses, após ter sido detectada a referida
2
bactéria.
25
[b] contínua, na qual os atributos podem estar dentro de uma faixa contínua de
O fato interessante é que, nessa última informação, é que iremos nos deter,
considerando o carro chefe no processo de criação de tabelas e gráficos, pois são
dados quantitativos. Por isso, entende-se como informação quantitativa os atributos
quantificados e dispostos num intervalo numérico.
[a] Suponha que queremos plotar o gráfico dos diâmetros de um conjunto de árvore
de um parque de preservação florestal, com mais de dez anos de existência. Temos
aqui o limite de área, que é o tamanho do parque. A definição do conjunto, que são as
árvores. E a amostra, que é composta por árvores desse parque, com um mínimo de
dez anos. Feita a catalogação desses diâmetros, vamos plotar o gráfico com a
quantidade de árvores com diâmetros nas faixas F1, F2, F3 e F4 (determinado após as
pesquisas, segundo um critério matemático). Nesse caso, poderíamos tomar, por
exemplo, diâmetros entre 0 e 20cm, como sendo a F1. Neste caso, o “zero” está
UPE - Universidade de Pernambuco
[b] Suponha agora que queremos plotar o gráfico das temperaturas médias
encontradas em cinco pontos distintos de um parque de preservação florestal, a
partir das seis horas da manhã até as dezoito horas de um mesmo dia, durante uma
semana de cada mês. Aqui, vê-se que não vamos encontrar a temperatura de zero
graus, logo, ao traçar o gráfico da semana de cada mês versos a temperatura, não
teremos o ponto zero no gráfico, apesar de poder colocá-lo como referência. Embora
esta referência seja útil para dimensionarmos o eixo das abscissas (ou o eixo x, no
2 sistema de coordenada cartesiana).
26 Exercício 2.1
NEED - Núcleo de Estudo em Educação a Distância
Apuração de Dados
Logo, para resolver esse problema, ou seja, para levantar dados, precisamos apurá-
los, definindo primeiro quem é a variável. Nesse caso, vamos chamar de X essa
variável, que, pela natureza do problema, é o indivíduo: família. Assim sendo, temos: 2
Vamos supor que nesse espaço de reserva para a pesquisa, ou seja, rua X, bairro Y, da
cidade do Recife, existam 20 (vinte) casas. E do levantamento observou-se que, se
associarmos cada casa como sendo uma família, temos:
CASA NÚMERO DE FILHOS CASA NÚMERO DE FILHOS
01 2 11 4
02 4 12 1
03 0 13 2
04 0 14 2
05 1 15 6
06 5 16 3
07 3 17 2
08 2 18 2
09 9 19 1
10 1 20 3
UPE - Universidade de Pernambuco
Numa rápida análise desses dados, percebemos que o maior número de filhos se
encontra na casa 15, que é de seis filhos, e o menor número de filhos encontrados,
fora de zero. Assim, num primeiro momento, podemos dizer que o número de filhos
dessa amostra, varia de zero até seis.
E temos que:
Ou seja:
Número de filhos - X 0 1 2 3 4 5 6
Número de famílias - xi 2 4 6 3 2 2 1
Dizemos, então, que
[a] a variável 0 filho assume valor 2, ou seja, duas famílias.
[b] a variável 1 filho assume valor 4, ou seja, quatro famílias.
[c] a variável 2 filhos assume valor 6, ou seja, seis famílias.
[d] a variável 3 filhos assume valor 3, ou seja, três famílias.
[e] a variável 4 filhos assume valor 2, ou seja duas famílias.
[f] a variável 5 filhos assume valor 2, ou seja, duas famílias.
TABELA – 01
Observe, também, que o número de filhos pode ser calculado com um olhar sobre a
tabela acima, ou seja, basta multiplicar o número de filhos por cada freqüência de
ocorrência e, depois, somar, assim sendo:
Nº de filhos = 0x2 + 1x4 + 2x6 + 3x3 + 4x2 + 5x2 + 6x1 = 0 + 4 + 12 + 9 + 8 + 10
+ 6 = 49
Um outro dado que pode ser obtido desta tabela é o percentual da freqüência de
ocorrência, ou seja, as freqüências relativas, que será representada por fr. Onde:
Freqüência relativa é a razão entre o número de ocorrência de uma certa variável pelo
total das freqüências de ocorrência, ou seja:
UPE - Universidade de Pernambuco
fi
fr ?
? i
fi
onde o ∑
f é o total da soma de todas as freqüências de ocorrência
i
i
2
2 fr =
20
=
0,1
TABELA – 02
APURAÇÃO DE DADOS
n fi n x fi fr
0 2 0 2/20 = 0,10
1 4 4 4/20 = 0,20
2 6 12 6/20 = 0,30
3 3 9 3/20 = 0,15
4 2 8 2/20 = 0,10
5 2 10 2/20 = 0,10
6 1 6 1/20 = 0,05
TOTAL 20 49 20/20 = 1
Observe que esta tabela pode ser ainda acrescida de uma informação em percentual
para os dados obtidos da freqüência relativa. Assim:
TABELA – 03
APURAÇÃO DE DADOS
n fi n x fi fr %
0 2 0 2/20 = 0,10 10
1 4 4 4/20 = 0,20 20
Agora, podemos perceber que, o maior percentual está ligado às famílias que
possuem dois filhos (30%), seguindo-se das famílias que possuem um filho (20%), ou
seja, metade das famílias dessa rua têm um ou dois filhos.
2
Exercícios 2.2
31
01 - Em uma pesquisa realizada com 200 pessoas, pergunta-se. Qual o seu estado
APURAÇÃO DE DADOS
Estado civil - Freqüência de Freqüência Porcentagem
n ocorrência - fi relativa - fr %
TOTAL
02 - Em uma pesquisa socioeconômica sobre itens de conforto, perguntamos a
800 entrevistados: quantos aparelhos de televisão em cores há em sua casa? Os
resultados aparecem na tabela abaixo: (complete a tabela).
APURAÇÃO DE DADOS
Número de Freqüência de Freqüência Porcentagem
aparelhos n ocorrência - fi relativa - fr %
0 20
UPE - Universidade de Pernambuco
1
2
3 0,6
4 7,5
5 30
TOTAL
Observação 01:
Todas essa tabelas até agora estudadas são as ditas tabelas unidimensionais, ou seja,
2 trabalha-se com uma variável. Caso estejamos a trabalhar com duas variáveis, por
exemplo, dizemos que ela é do tipo tabelas bidimensionais. Vejamos um exemplo de
32 uma tabela bidimensional:
NEED - Núcleo de Estudo em Educação a Distância
Com esta informação adicional, os dados a seguir são relativos ao peso ao nascer (em
gramas) de recém -nascidos com síndrome de desconforto idiopático grave. Algumas
crianças foram a óbito (*), e outras sobreviveram.
Observação 02:
-Ao usarmos nas tabelas o nome freqüência de ocorrência, faz-se necessário saber
que, muitas vezes, nessa coluna, aparece simplesmente o nome freqüência ou
freqüência absoluta. Que agora pode ser representada apenas por f, e não há
necessidade de apresentarmos como fi como vínhamos fazendo, fato que simplifica
a tabela embora o significado seja o mesmo.
-Um outro caso de estudo das freqüências na construção das tabelas, para uma
posterior construção de gráficos, é a chamada freqüência acumulada. Esse tipo de
freqüência pode incidir sobre as freqüências absolutas e sobre as freqüências
relativas. Como o próprio nome sugere, a freqüência acumulada é a soma (acúmulo)
das freqüências absolutas ou relativas de dois ou mais subconjuntos de dados.
TABELA – 04
APURAÇÃO DE DADOS
n f faa fr far nxf %
0 2 2 0,10 0,10 0 10
1 4 6 0,20 0,30 4 20
2 6 12 0,30 0,60 12 30
3 3 15 0,15 0,75 9 15
4 2 17 0,10 0,85 8 10
5 2 19 0,10 0,95 10 10
2 6 1 20 0,05 1 6 2
TOTAL 20 1 49 100
34
NEED - Núcleo de Estudo em Educação a Distância
Isso apresenta uma grande vantagem para a leitura da tabela, pois, num olhar sobre
ela pode-se perceber que famílias com números de filhos menores que dois (2, 1 ou
0) são maioria, ou seja, são 12 (ver faa) dentre as 20 famílias, fato que corresponde a
0,60 (60%) do total (veja que temos um acúmulo de 10 + 20 + 30 = 60).
Vale salientar que na construção da tabela 04, usamos o fato de termos faa e far
como crescente, embora nada impeça que possamos usá-la como decrescente,
conforme mostra a tabela na outra página.
TABELA – 05
APURAÇÃO DE DADOS
n f faa fr far nxf %
0 2 20 0,10 1 0 10
1 4 18 0,20 0,9 4 20
2 6 14 0,30 0,7 12 30
3 3 8 0,15 0,4 9 15
4 2 5 0,10 0,25 8 10
5 2 3 0,10 0,15 10 10
Exercício 2.3
Diagrama de Pareto 2
35
Uma forma de complementar esse dados tabulados é expressá-los através de
Hoje a importância dos gráficos nos estudos da Estatística e sua difusão nos meios
sociais com informações para todo um público demonstram a validade de seus
estudos e sua possível praticidade diante dos olhos do outro, ou seja, daquele que se
dispões a lê-los e a interpretá-los, segundo o vislumbre das informações contidas na
comunicação visual e dos interesses que esses elementos estatísticos (tabelas e
gráficos) apresentam para quem os lê.
[a] trace um eixo horizontal e divida esse eixo em tantas partes iguais quantas são as
categorias listadas na tabelas;
[c] trace barras verticais, com base no eixo horizontal e altura igual à freqüência da
categoria. A figura resultante é o diagrama de Pareto;
[d] complete a figura, colocando título, unidades, datas e nome do responsável pela
coleta de dados.
Para termos uma idéia desse processo, elabora-se o Diagrama de Pareto para os
dados da Tabela 02. Vejamos o gráfico:
Observe na tabela 04 que, para o caso inicial de zero filho, temos 0,20 (20%) para os
dois caso juntos, ou seja, zero e um filho temos 0,30 (0,10 + 0,20), ou seja, 30%. E,
assim por diante, conforme a citada tabela, que termina em 1 (100%).
2
37
Vejamos esta construção. Primeiro: elabora-se o gráfico conforme o anterior, com
Como o referido gráfico vai de 0 (zero) até 7 (sete), na abscissa, enquanto a far vai de
0,10 até 1,00, na ordenada. Por esse motivo, vamos colocar o gráfico com dez
divisões na ordenada significando cada parte correspondente a 0,10 ou 10%.
UPE - Universidade de Pernambuco
Desse modo, observe que a referida construção segue os mesmos passos para o caso
da far decrescente (o gráfico acima se refere a far crescente).
Exercício 2.4
Exemplo:
Na tabela abaixo, apresenta-se o número de internações em estabelecimentos de
saúde, por espécie de clínica, no ano de 1992. Veja o gráfico de barras desses dados
logo abaixo.
2
39
Gráfico de Setores
logo:
360 f
x?r
100
UPE - Universidade de Pernambuco
Exercício 2.5
Histograma
3
Consumo de água, em m , de 75 contas da SABESP
32 14 22 11 34 40 16 26 23 13 31 27 10 38 17
45 25 10 18 23 35 22 30 14 18 20 13 24 35 29
33 48 20 12 31 39 17 58 19 16 12 21 15 12 20
51 12 19 15 41 21 29 25 13 23 32 14 27 43 37
28 37 26 44 11 53 38 46 17 36 28 49 56 19 11
Veremos agora como montar os intervalos. Já sabemos que o menor valor é 10, e o
valor da Amplitude de Classe é 6, logo, a primeira classe consistirá dos dados entre
UPE - Universidade de Pernambuco
10 até 16. Ou seja, a partir do valor 10 até números próximos de 16, sem ser
necessariamente o 16. E, assim, segue durante toda a construção das outras classes.
Antes, vamos fazer a contagem dos dados contidos em cada classe, o que vai
representar a freqüência absoluta. Sendo assim, temos a tabela:
Observação:
A Amplitude total está aqui representada pela letra A, porém, ela também aparece AT
em algumas representações. O importante aqui é o estudante entender o seu
significado.
2
Classe Freqüência Freqüência
42 absoluta relativa
10 ? 16 16 21,33%
NEED - Núcleo de Estudo em Educação a Distância
16 ? 22 15 20,00%
22 ? 28 12 16,00%
28 ? 34 10 13,33%
34 ? 40 9 12,00%
40 ? 46 6 8,00%
46 ? 52 4 5,33%
52 ? 58 3 4,00%
TOTAIS 75 100%
Com estes dados, agora, passamos a construir o histograma. Para tal, desenhamos o
sistema de eixos cartesiano, no qual: no eixo das abscissas representamos os
intervalos de classes e no eixo das ordenadas, as freqüências absolutas.
UPE - Universidade de Pernambuco
Na parte superior deste gráfico, traçamos o polígono de freqüência. Para tal, basta
tomar o ponto médio de cada coluna em sua parte superior e unir cada um desses
pontos. Observe o polígono de freqüência na linha que envolve o histograma. 2
10 ? 16
P1 ? ? 13
2
Exercício 2.6
Dada a tabela abaixo, dos pesos de crianças nascidas vivas em quilogramas, construa
o histograma de freqüência absoluta e de freqüência relativa. E, ao representar o
histograma, registre o ponto médio de cada intervalo de classe.
Peso ao nascer de nascidos vivos em quilogramas
2,522 3,100 2,900 3,100 3,600 3,200 2,700 2,750 2,480 2,900
2,720 3,200 2,950 3,150 2,500 4,100 3,150 4,200 3,900 3,700
3,125 2,780 2,480 2,800 2,300 2,400 2,800 2,100 2,500 2,120
3,250 3,155 3,800 2,900 2,950 2,700 2,700 4,450 2,480 3,150
3,220 2,150 2,500 1,900 3,000 2,450 3,300 2,900 2,450 2,400
3,000 3,300 3,550 3,600 3,750 3,400 3,200 2,920 3,400 3,450
3,725 3,250 3,000 3,200 3,150 2,400 3,200 2,720 3,400 3,120
2,890 3,200 4,100 3,300 3,200 3,120 2,800 2,900 1,570 2,120
UPE - Universidade de Pernambuco
3,110 3,720 3,200 2,900 2,500 3,400 4,600 2,000 3,800 2,450
3,520 2,800 3,450 2,500 2,900 3,200 1,720 2,720 2,700 2,700
2
44
NEED - Núcleo de Estudo em Educação a Distância
Referência Bibliográfica
1 - Percentagens
São razões que consistem em considerar um total qualquer igual a 100% e, através de
uma regra de três, estabelecer qualquer relação com as parcelas que compõem o
total assim:
3 Total — 100%
Parcela — x%
48 O que nos leva a:
NEED - Núcleo de Estudo em Educação a Distância
parcela
percentagem ? ?
100
total
Onde o x na regra de três está representado na equação logo a seguir pela palavra
percentagem. Isto significa que o valor de x, encontrado na regra de três, expressa um
valor na forma de percentagem (daí a multiplicação por 100% que tem o significado
de total). Por exemplo, encontrando-se x = 32 se expressa esse valor na forma de
percentagem 32%.
Exercícios 3.1
03 - No mês de agosto, Pedro observou que o valor da sua conta de energia elétrica
foi de 50% superior ao valor da sua conta de água. Em setembro, tanto o consumo de
energia elétrica, quanto o de água, na residência de Pedro, foram iguais aos
consumos do mês de agosto. Porém, como as tarifas de água é energia elétrica foram 3
reajustadas em 10% e 20%, respectivamente, Pedro desembolsou R$ 20,00 a mais do
que em agosto para quitar as duas contas. Quanto Pedro pagou de energia elétrica no 49
mês de setembro?
05 - Um comerciante compra uma peça de tecido de 50m. Se ele vender 20m com
um lucro de 50%, outros 20m com um lucro de 30% e os restantes pelo preço de
custo, calcule seu percentual de lucro na venda da peça.
06 - Sabendo-se que o Índice Geral de Preços ( IGP ) de junho de 2002 foi de 1,74%
e no mês de julho do mesmo ano foi de 2,05%, qual o percentual de aumento de um
mês para o outro?
Um outro fato também importante, é que as percentagens podem ser utilizadas de
inúmeras formas, segundo a circunstância que queiramos estudar. Vejamos dois
casos:
Consideremos a série:
UPE - Universidade de Pernambuco
Total 21201
19286 x100
Ensino Fundamental ? ?
90,96 Isto nos leva a
21201
91,0%
1681x100
Ensino Médio ? ?
7,92 Isto nos leva a
21201
7,9%
234 x100
Ensino Superior ? ? 1,10 Isto nos leva a
21201
1,1%
Observe a soma:
91,0% + 7,9% + 1,1% = 100%
Com esses dados podemos formar uma nova coluna na série em estudo:
Vamos agora fazer uma interpretação dos dados obtidos nesta nova coluna. Esses
valores nos dizem que, cada 100 alunos da cidade Z, 91 estão matriculados no Ensino
Fundamental, 8, aproximadamente, no Ensino Médio e 1 no Ensino Superior. Com
isto, podemos observar que o emprego da percentagem é de grande valia quando é
nosso intuito destacar a participação da parte no todo. Este estudo comparativo pode
ser muito útil na análise de dados numa série estatística, como podemos ver a seguir.
3
Consideremos, agora, a série:
51
Qual das cidades tem, comparativamente, maior número de alunos em cada nível de
ensino?
Como o número total de alunos é diferente nas duas cidades, não é fácil concluir a
respeito usando os dados absolutos. Porém, usando as percentagens, tal tarefa
apresenta-se como a forma ideal para a resposta ao questionamento. Para tal, vamos
acrescentar na tabela anterior as colunas correspondentes às percentagens, relativa a
cada nível de ensino, para cada cidade.
Matrículas nas Instituições de Ensino das cidades Z e T no ano 2000
Cidade Z Cidade T
A análise. A resposta com os dados brutos não seria tão bem posta, como a que se
apresenta com os dados relativos. Pois, num primeiro olhar poderíamos fazer um
julgamento errôneo do fato, uma vez que a cidade T, aos olhos dos dados brutos,
apresenta mais estudantes em todos os níveis de ensino, se comparada com a cidade
Z. Mas, quando vamos dar uma olhada nos dados relativos, isto nos permite dizer
que, comparativamente, contam, praticamente, com a mesma taxa de estudante em
3 cada nível de ensino. Ou, com o mesmo número de estudantes para cada deles
tomados como referência 100. E, poderíamos informar que, para cada 100
52 estudantes, as cidades Z e T apresentam as mesmas taxas para os três níveis de
ensino.
NEED - Núcleo de Estudo em Educação a Distância
Observação:
Do mesmo modo que tomamos 100 para a base de comparação, também podemos
tomar outro número qualquer, como por exemplo, 1 ou 1000 (base decimal).
Base - 100%
Valores - x%
Com isto:
3
Valores ?
?
Percentagem ?
? ?
?Base ?
x100 53
Vejamos os cálculos:
3600 ?
?
Ano 96 ??? x100 ?
112,5%
3200 ?
?
3360 ?
?
Ano 97 ??? x100 ?
105,0%
3200 ?
?
Exercício 3.2: Faça (continue) os cálculos para os anos: 1998; 1999; 2000 e 2001.
Comentários:
Base móvel
Este caso difere do anterior, pois a base se modifica para cada dado. Onde, cada novo
dado sempre será relacionado com o dado anterior. Vejamos, o exemplo a seguir:
Base – 100%
Valores – x%
Com isto:
Valores ?
?
Percentagem ?
? ? x100
?Base ?
Vejamos os cálculos:
95 ?
Não existe dado anterior, por tanto esse percentual é inexistente.
3600 ?
?
96 ?Percentagem ?
?? x100 ?
112,5%
3200 ?
?
3360 ?
?
97 ?Percentagem ?
?? x100 ?
93,3%
3200 ?
?
Comentários:
Os valores dessa nova coluna mostram como evoluem a produção de um ano para o
outro. Por exemplo:
De 1995 para 1996 tivemos um acréscimo na produção de 12,5%
De 1996 para 1997 a produção decaiu em -6,7%. 3
De 1997 para 1998 não houve alteração na produção.
55
De 1998 para 1999 a produção decaiu em -4,8%
2 - Índices
“Em termos gerais, um número-índice pode ser concebido como uma medida
estatística destinada a comparar, através de uma expressão quantitativa global,
grupos de variáveis relacionadas e com diferentes graus de importância. Através dele
obtém-se um quadro resumido das mudanças ocorridas em áreas afins (TOLEDO e
OVALLE, 1985, p. 311)”. Este resumo dá uma visão geral do referido tema, que aqui
será exposto apenas através das expressões quantitativas para um exercício de
configuração deste conteúdo.
Uma definição deste tema é dizer que, índices são razões entre duas grandezas tais
que uma não inclui a outra (grandezas independentes).
São exemplos de índices:
Onde:
IC = Índice Cefálico; DT = Diâmetro Transverso do Crânio; DL = Diâmetro
Longitudinal do Crânio
UPE - Universidade de Pernambuco
Onde:
QI = Quociente Intelectual; IM = Idade Mental; IC = Idade Cronológica.
Exemplo:
Logo:
200000
1993 ?Receita per capita = ?
50
4000
800000 3
1996 ?Receita per capita = ?
100
8000
57
Porém:
100 - 50
220 - x
Resolvendo:
X = 110 a instituição piorou, pois necessitaria de $10 a mais do
que é hoje (1996) a sua renda per capita.
3 - Coeficientes
Onde:
CN = Coeficiente de Natalidade; NN = Número de Nascimento; PT = População
Total.
3 Coeficientes Educacionais
58
[a] Coeficiente de Evasão Escolar
NEED - Núcleo de Estudo em Educação a Distância
NE
C EE ?
N IM
Onde:
CEE = Coeficiente de Evasão Escolar; NE = Número de alunos Evadidos;
NIM = Número Inicial de Matricula
É a mes ma coisa que coeficiente, apenas apresentando -se multiplic ada por uma
potência de 10 (dez) (10, 100, 1000 etc.) para tornar o resultado mais inteligível, uma
vez que sempre especificamos os dados em formas relativas. Desse modo temos a
expressão:
Exemplos de taxas:
Vejamos a segunda:
TATg ? g
C AT x10 6
Onde:
g N HPA
C AT ?
N OH
Sendo:
g
C AT = Coeficiente da gravidade nos Acidentes de Trabalho; NHPA = Número de Horas
Perdidas em razão dos acidentes; NOH = Número de Operários Hora.
Exercícios Resolvidos
O que significa que nesta empres a, em cada 1000000 de operários –hora, ocorreram
200 acidentes.
200
TATg ? x10 6 ? 8000
50 x500
O que significa que, nesta empresa, em cada 1000000 de operários–hora, 8000 horas
são perdidas em virtudes de acidentes.
II - A cidade X apresentou 12793 matr ículas nas séries iniciais, no iní cio do semestre
2000 e , 10347 no fim do ano 2000. A cidade Y apresent ou os seguintes números:
8349 no iní cio de 200 0 e 6649 matrí culas no final de 2000. Qual e a cidade que
apresentou mais evasão escolar?
Cidade X:
NE
Como: TEE = CEE x 102 mas C EE ? onde N E = Número de alunos
N IM
evadidos.
Logo:
Cidade Y:
NE
Como: TEE = CEE x 102 mas C EE ? onde N E = Número de alunos
N IM
evadidos.
Logo:
NE = 8349 – 6649 = 1700 e que NIM = 8349 com isto CEE = 0,204
Daí:
TEE = 0,204 x 102 = 0,204 x 100 = 20,4% 3
Conclusão: a cidade que apresentou a maior evasão escolar foi a cidade Y. Observe 61
que o valor do coeficiente já diz esta realidade, porém, a informação em termos
Resolução:
Temos: Número de óbitos: NO = 80080 e que a População Total : P T =
520000
Como
NO 80080
CM ? logo CM ? ?
0,154
PT 520000
Mas:
TM = CM x 103 logo TM = 0,154 x 10 3 = 0,154 x 1000 =
154 0 00
Ou Seja:
Evolução das receitas do Café industrializado de Janeiro até Abril do ano de 2002
[3] Um professor preencheu um quadro, enviado pela D.E, com os seguintes dados:
1° B 49 44 35 03 06 05 01 40 04
1° C 49 42 42 00 00 00 00 42 00
1° E 47 35 27 00 08 03 05 30 05
1° F 47 40 33 06 01 00 01 33 07
[5] Uma cidade de 320000 habitantes apresenta uma taxa de natalidade de 3,2% ao
ano e uma taxa de mortalidade de 27% ao ano. Calcular o aumento da população em
um ano.
[6] Uma entidade assistencial em 1998 atendia 500 internos com uma verba de
R$200.000,00. Em 2003, os internos aumentaram em 20%, enquanto que a verba
aumentou 50%. Sabendo-se que o custo de vida, pela desvalorização da moeda,
aumentou em 40% no mesmo período, indaga-se se a situação financeira da
entidade, por interno atendido, melhorou ou piorou?
[7] Em uma empresa que possui 250 operários, trabalhando durante 60 dias de 8
horas cada um, verificaram-se 32 acidentados de trabalho, ocasionando uma perda
de 146 horas. Calcular a taxa de freqüência e de gravidade de acidente do trabalho.
UPE - Universidade de Pernambuco
3
64
NEED - Núcleo de Estudo em Educação a Distância
Referência Bibliográfica
CRESPO , Antônio Arnot. Estatística Fácil. 17ª Edição, São Paulo, SP; Ed.
Saraiva,1999.
SPIEGEL, MR. Estatística. 2ª edição. São Paulo, SP: Ed. Mcgranw Hill,
1985.
Medidas de Tendência
Central e Separatizes FASCÍCULO
1. Médias
O número destinado a resumir uma série de dados diz-se média, designação que
significa que a síntese deve ser um valor intermediário aos valores dados, não
4 devendo ser inferior ao menor termo da série, nem superior ao maior deles.
68
A média deve satisfazer, os números que representam algumas condições lógicas ou
NEED - Núcleo de Estudo em Educação a Distância
Principais Médias:
[a] Aritmética.
[b] Geométrica.
[c] Harmônica.
[d] Potência (cúbica, biquadrada, etc.).
Onde:
Médias simples: são aquelas obtidas do conjunto cujos elementos têm a mesma
importância ou o mesmo peso.
?
x
n
i
4
i?
1
x?
Exemplo 1:
n
69
i?
1
?
x
2?
0?i
5?
3
x? ? ?
2,5
4 4
i?
1
?
x .F i i
x?
n
Exemplo 2.
xi 2 5 6 8
Fi 1 4 3 2
seguida produzir o produto xi .Fi . Depois somar a coluna de freqüência sim ples e
somar o produto de cada elemento da série pela sua freqüência, para depois calcular
a média.
xi Fi xF
ii
4
?
x .F
i?
1 56i i
x? 4
? ?
5,6
10
? Fi
i?
1
4
70
Interpretação:
NEED - Núcleo de Estudo em Educação a Distância
Exemplo 3:
Determinar a média aritmética das alturas (x) dos estudantes de uma classe de Ensino
Médio apresentada na tabela abaixo (dados agrupados com intervalo de classe).
x(cm) xi Fi xF
ii
Calculando:
5 ?
x .Fi
6465i
?
n?Fi ?
40 x? i?
1
? ?
5
40
161,6cm
i?
1
?
Fi
i?
1
Interpretação:
n 4
xg ?
n
?
xi ou que
i?
1
xg ?
n x .x .x ...x
1 2 3 n
71
Exemplo 4:
Sejam x1, x2, x3, ..., Xn valores de x, associados às freqüência absolutas F1, F2, F3, ..., Fn
respectivamente. Então, a média geométrica de x é:
n n
xg ?
n xiFi ou que x g ?
? n
x1F1 .x2F2 .x3F3 ...xnFn ?
onde n ?Fi
i?
1 i?
1
Observação:
Exemplo 5:
xi 1 2 3 5
Fi 8 6 5 3
UPE - Universidade de Pernambuco
Teremos:
22 8
xg ? 1 x 2 6 x 35 x 5 3 ?
22 22
1x64 x 243 x125 ? 1944000 ?
1,93
Nota:
Logo:
n
F1 log x1 ?
F2 log x2 ?
F2 log x3 ?
... ?
Fn log xn
log x g ?
n i?
1
?
sendo n ?Fi
8 log1 ?
6 log 2 ?5 log 3 ?
3 log 5 8 x0 ?
6 x0,3010 ?
5 x0,4741 ?
3 x0,6990
log x g ? ? ?
0,2858
22 22
Daí:
n
?
F log x
i i n
xg ?
anti log i?
1
n
?
com n ?Fi
i?
1
xg ?
1,93 que é o mesmo resultado anterior.
Exemplo 6:
4
Resolvendo:
73
n
xh ?n
1
?
i?1 xi
Exemplo 7:
Temos:
4 4 4 x630
xh ? ?? ? 4,2
1 1 1 1 601 601
? ? ?
UPE - Universidade de Pernambuco
2 5 7 9 630
Sejam x1, x2, x3, ..., xn valores de x, associados às freqüências absolutas F1, F2, F3, ..., Fn
respectivamente.
x1 x2 x3 xn i?1 xi
Exemplo 8:
Calcular a média harmônica dos dados (sem intervalo de classe) da tabela abaixo.
xi Fi Fx
i / i
?
Apenas as duas primeiras colunas fazem parte do enunciado.
(A terceira coluna é construída como de interesse na solução do problema).
Resolvendo:
n
i? 1
i ?
F
24
Neste caso, temos xh ?n
o que nos leva a: xh ?? 3,7
Fi 6,5
?
i?1 xi
Exemplo 9:
Calcular a média harmônica para os dados das estaturas dos alunos do curso de
Licenciatura Plena em Biologia, da Faculdade de Formação de Professores de Nazaré
Solução:
Vamos construir uma coluna (na tabela de dados) com a fração (e sua soma) Fi / xi ,
que é uma coluna de interesse na solução do problema, uma vez que a mesma serve
para uma melhor identificação dos dados na expressão matemática de interesse.
Estatura (cm) Fi xi Fi / xi 4
150 |— 156 5 153 0,03268
156 |— 162 4 159 0,02516 75
162 |— 168 19 165 0,11515
Resolvendo:
?
F
i? 1
i
76
xh ? n
? xh ? ?
171,1cm
Fi 0,44408
?
i? 1 xx
1.4 Média quadrática: É a raiz quadrada da média aritmética dos quadrados dos
elementos da série.
n
2
?
x
i?
1
i
xq ?
UPE - Universidade de Pernambuco
Exemplo 10:
Na solução desse exercício é bom construir uma tabela com os xi e seus valores
quadráticos, bem como a soma desses valores quadráticos, para aplicação na
4 expressão matemática.
76 6 17 9 9 3 13 9 1 SOMA
xi
NEED - Núcleo de Estudo em Educação a Distância
Daí:
747
xq ? ? 93,375 ?
9,7
8
n
2
?
x .F i i n
xq ? i?
1
n
com ?
n?Fi
?
F
i?
1
i
i?
1
Exemplo 11:
Calcular a média quadrática para os dados (sem intervalo de classe) da tabela abaixo.
Resolvendo:
?
x .F 2
i i
340
4
i?
1
Temos: xq ? n
o que nos leva a: xq ? ? 34 ?
5,8
14
?
F
i?
1
i 77
Em uma pesquisa sobre a duração de certa pasta dental junto a 50 famílias do mesmo
tamanho e classe social os resultados foram abaixo descritos. Calcular a duração
média da pasta dental (com intervalo de classe).
Resolvendo:
n
2
?
x .F
i?
1
i i
10386
xq ? n
? ?
14,4dias
50
?
UPE - Universidade de Pernambuco
F i
i?
1
78 Solução:
NEED - Núcleo de Estudo em Educação a Distância
i?
1
?
x
2?
4?
6?
8?
10 i
Média Aritmética ?xA ? ? ?
6
n 5
n
Média Geométrica ?xg ?
n
? 5
xi ? 5
2 x 4 x6 x8 x10 ?
i?
1
3840 ?
5,2
n 5 5 5 x120 600
Média Harmônica ?xh ?n
? ? ? ?? 4,4
1 1 1 1 1 1 137 137 137
?
i?1 xi
? ? ??
2 4 6 8 10 120
n
2
?
x
2 i?
1
i 2
42 ?
? 62 ?
82 ?
10 2 220
Média Quadrática ?xq ? ? ? ? 44 ?
6,6
n 5 5
Como pode ser notado através deste exemplo xh ?
xg ? xq pois: 4,4 < 5,2 < 6 <
xA ?
6,6.
Observação:
Resolução:
79
i?
1
?
p .x i i
(3 x 2) ?
( 2 x 2) ?
(4 x5) 36
x? n
? ? ?
4
3?
2?
4 9
? pi
i?
1
neste caso, teremos a média final do conjunto ( x f ) que é uma média ponderada com
pesos representados pelos números de termos das séries componentes desse
conjunto.
i?
1
?
n .x i i
(30 x8) ?
(20 x9) ?
(50 x6) 720
xf ? n
? ?? 7,2
30 ?
20 ?
50 100
? ni
UPE - Universidade de Pernambuco
i?
1
IV - Um vendedor viaja da cidade “A” para cidade “B” a 50 km/h e volta a 90km/h.
Determinar a velocidade média de toda a viagem. (Observe que a distância
percorrida é a mesma)
Resolução:
n 2 2 2 2 x 450 900
v?
xh ?n
? ? ? ? ?? 64,3km / h
1 1 1 9? 5 14 14 14
?
i?1 xi
?
50 90 450 450
Observação:
V Um carro percorre 80km com uma velocidade escalar média de 40km/h, 150km
com velocidade escalar média de 50km/h e os 200km restantes de sua viagem a uma
velocidade média de 100km/h. Qual a velocidade média em todo o percurso?
Resolução:
Neste caso temos o fato de que as distâncias percorridas pelo móvel têm valores
diferentes, e estes valores vão passar a ser as freqüências (dados sem intervalos de
classe) para a média harmônica, com o intuito de calcular a velocidade escalar média
de todo o percurso.
?
F
i? 1
i
80 ?
150 ?
200 430 430
v?
xh ? ? n
? ?? 61,4km / h
F 80 150 200 1400 7
?1 xi
i?
? i
?
40 50 100 200
Resolução:
n ?
2000032000
tx ?
h ?
n
?
Fi 2000032000
?
5,78 meses 4
?
i?
1 xi 4
?
8
81
Resolução:
(1 + r) 3 = 4 ?
1000.(1 + r)³ = 4000 ? 1+r= 3 4 ?
1 + r = 1,587 ?
r=
0,587
Ou que:
r = 0,587 x 100% = 58,7%
Observação:
De uma maneira geral, se parte de uma quantidade P, que cresce a uma taxa
constante r por unidade de tempo, tem-se, após “n” unidades de tempo, um total:
T = P.(1 + r) n
UPE - Universidade de Pernambuco
Tarefa 4.1
02 - Calcule a idade média dos alunos de uma classe de primeiro ano de determinada
4 faculdade, em anos.
18 18
19 17
20 8
21 4
1 0 |— 1 1
2 1 |— 2 5
n
3
i?
1
3
?
x i
xc ? ?[a] Mc simples (dados não agrupados)
n
n
3
3
i?
1
?
xF ii
xc ? ?[b] Mc ponderada (com ou sem intervalo de classe)
n
n
4
i?
1
4
?
x i
xbq ? ?[a] Mbq simples (dados não agrupados)
n
UPE - Universidade de Pernambuco
n
4
4
i?
1
?
xF i i
xbq ? ?[b] Mbq ponderada (com ou sem intervalo de
n
classe)
Tarefa 4.2:
Cálculo da Mediana
Para calcular a mediana vamos fazer uso de três técnicas diferentes para os cálculos:
[a] Dados brutos ou rol, neste cálculo tem apenas os dados na forma não agrupados;
[b] Dado repetido, neste caso os dados agrupados são sem intervalo de classe; [c]
Dados agrupados em classes, ou seja, neste item temos os intervalos de classe.
Observe que essas três formas de agir são as mesmas que vínhamos trabalhando
para as médias.
[a] Dados brutos ou rol
Exemplo 01:
Resolução: 4
colocando os números que compõem a série em ordem crescente de valor, temos:
1,3,4,6,7,9,15,16 e 19. 85
Observação:
A posição em que ocupa o valor 7, no rol, deixa a sua esquerda e a sua direita o
mesmo número de elementos, sendo, portanto, o elemento central da série.
a.2 - Se n é par
n
Neste caso, o rol admite dois termos centrais que ocupam as posições P ' ? e
2
n
P '' ? ?1 . A mediana é convencionada como sendo a média aritmética dos valores
2
que ocupa estas posições centrais.
Exemplo 02:
Solução:
n 8 n
P' ?? 4 ou seja, 4ª posição e P '' ?
? ?
1?
4?5 que é a 5ª posição.
1?
2 2 2
Onde:
4 O elemento que ocupa a quarta posição na série é 10 e o elemento que ocupa a quinta
posição é 13. Portanto,
86
NEED - Núcleo de Estudo em Educação a Distância
Interpretação:
50% dos valores do rol são valores menores ou iguais a 11,5 e 50% dos valores do rol
são valores maiores ou iguais a 11,5.
xi Fi Solução:
o n° de elementos de série é a soma de todas as freqüências, ou seja,
n = 23 (ímpar). Portanto, a série admite apenas um termo central
que ocupa a posição central que é a soma de 23 +1 dividido por 2,
que tem como resultado 12, compreendido como o décimo segundo
lugar no conjunto de números dados (que são 23).
Interpretação:
50% dos valores da série são menores ou iguais a 8, e 50% dos valores da série são
maiores ou iguais a 8.
Exemplo 04:
Interpretação:
50% dos valores da série são valores menores ou iguais a 2,5 e 50% dos valores da
série são valores maiores ou iguais a 2,5.
n/2?
? F ?
Me ? ? a?
Li ? h
? F ?
Onde:
Exemplo - 05:
4
Calcular a mediana de distribuição de notas dadas na tabela abaixo.
89
NOTAS ALUNOS - F Fa
Como a fórmula de cálculo citada refere bastante sobre dados da classe mediana, é
muito importante a sua determinação, o que é feito através da posição (P = n/2) da
mediana e da coluna de freqüência acumulada. No caso, a posição da mediana é P =
n/2 =320/2=160.
n/2?
? F ? ? 160 ?104 ? ? 56 ? 560
Me ? ? a?
Li ? h?
50 ?
? 10 ?
? 50 ?
? 10 ?
? 50 ?? 56,2
? F ? ? 90 ? ? 90 ? 90
4 A mediana é igual à nota 56,2. Isto revela que tal resultado coloca um certo número
de alunos com notas inferiores a 56,2 bem como, aqueles alunos com notas
90 superiores a 56,2.
NEED - Núcleo de Estudo em Educação a Distância
2.1 Separatrizes
Separatrizes (S) de uma série de n termos x1, x2, x3, ..., xn colocados em ordem
crescente (ou decrescente) de valor é o termo da série que a divide em duas ou mais
partes qualquer.
Exemplo 06:
A mediana é uma separatriz, como já foi dito, pois ela divide a série em duas partes
iguais.
Os quartis, decis e percentis (ou centis) são separatrizes que dividem a série,
respectivamente, em quatro, dez e cem partes iguais.
Quartis:
Decis: 4
Observação:
Responda: Qual o percentil que equivale à mediana numa série de dados numéricos?
Q1 ?
P25 Q2 ?
Me ?
D5 ?
P50 3 ?
75
4
D1 ?
P10 D2 ?
P20 D3 ?
P30 D4 ?
P40
92
D6 ?
P60 D7 ?
P70 D8 ?
P80 D9 ?
P90
NEED - Núcleo de Estudo em Educação a Distância
Observação:
Com exceção talvez para a mediana não é usual a utilização das demais separatrizes
(quartis, decis e percentis) para séries constituídas de dados isolados ou de dados
repetidos.
Agora vamos ver como proceder para encontrar estas separatrizes, ou seja, os
quartis, decis ou percentis (centis), para, evidentemente, dados agrupados com
classes de freqüências. A fórmula geral de cálculo, semelhante à fórmula da mediana
e é escrita como sendo:
P?
? F ?
S? ?a ?
Li ? h
?F ?
Onde:
S ?
separatriz desejada (mediana, quartil, decil ou percentil);
Li ?
limite inferior da classe que contém a separatriz;
P ?
posição da separatriz
Fa ?
freqüência acumulada da classe vizinha anterior à classe que contém a separatriz;
Observamos pela fórmula acima que nela interferem muitos dados da classe que
contém a separatriz. De modo semelhante ao utilizado para a mediana, localizamos
esta classe através da posição da separatriz e da coluna auxiliar de freqüência
acumulada, que iremos sempre acrescentar na tabela dada para uma melhor
visualização dos elementos desta expressão matemática.
n
Pi?
4
n
Pi?
10
......................................................................................
Nonagésimo nono percentil (P99) ? P = 99n/100
n
Pi?
100
i = 1, 2, 3, ..., 99 conforme se trata, respectivamente, do primeiro, segundo, terceiro,
..., nonagésimo nono percentil.
P = n/2
Para facilitar ainda mais os cálculo analítico de uma separatriz, apresentamos como
roteiro:
n n n n
Pi? ; Pi?; Pi? ; P ?
[iii] Com o auxílio dos itens anteriores, localizar a classe que contém a separatriz;
[iv] Usar a fórmula geral da separatriz S, observando que:
Determinar
[a] a mediana e o primeiro quartil, indicando as respectivas ordens percentílicas e
significados;
[b] a separatrizes com o respectivo significado, cuja ordem percentílica é 74;
[c] o peso acima do qual temos 20% de pessoas com pesos superiores a ele;
[d] a ordem percentílica corresponde a 64,4 kg e o seu significado;
Resolução
Então:
P−
F 220 −
120 600
S= a
Li + h=
66 +
6=
66 + =
69,3kg
F 180 180
Como se trata da mediana, que divide a série em duas partes, logo, a ordem
percentílica é de 50.
Conclusão: 50% das pessoas têm pesos inferiores (ou superiores) a 69,3kg.
Calculando:
P?
? F ? ? 110 ?
0 ? 660
S?
Q1 ? ?a ?
Li ? h?
60 ?
? ? 6?
60 ??65,5kg
?F ? ? 120 ? 120
440
OP = 74 ?
P74 onde P74 = 74x uma vez que i = 74 e n = 440 ?
P = 325,6
100
325,6 ?
? 300 ?
Este valor esta representado na classe 72 ?
78 onde S ?
P74 ?
72 ?
? 6
?
?80 ?
[c] O peso acima do qual temos 20% de pessoas com pesos superiores a ele é o
mesmo abaixo do qual se situam 80% (100% - 20%) de indivíduos com pesos
inferiores, ou, em outras palavras, é a separatriz cuja ordem percentílica é 80 (oitavo
decil ou octagésimo percentil).
440
Assim sendo, basta calcularmos D8 onde D8 = 8x ? D8 = 352
10
?352 ?300 ?
Este valor corresponde a classe 72 ?
78 onde S ?D8 ?
P80 ?72 ?? 6
?
? 80 ?
Daí: D8 = P80 = 75,8kg
[d] Este item se refere ao problema inverso: dá-se a separatriz e procura-se a ordem
percentílica que lhe corresponde.
UPE - Universidade de Pernambuco
?P? F ?
Da fórmula geral S ? Li ??a ? h , conhecemos S ? 64,4 kg , que pertencendo
Pi ?
? F ?
a classe 60 ? 66, nos conduz a Li = 60; F = 120; F a ( freqüência acumulada da classe
anterior à primeira) e h = 6. Assim, vem:
P? 0 6P
64, 4 ?
60 ? ? 6; ?
64, 4 ?
60 eP ?
120 ?
4, 4 / 6 ?
88 (posição da separatriz).
120 120
4 Assim, o significado é que 20% das pessoas pesam menos de 64,4 kg.
98
[e] Como as separatrizes necessárias à composição das faixas de pesos já foram
NEED - Núcleo de Estudo em Educação a Distância
Faixas
Classificação
OP Pesos (kg)
A moda, norma, valor modal, é por definição, o valor xk da série que ocorre com a
maior freqüência, isto é, o valor mais comum.
Um conjunto de valores pode apresentar mais de uma moda. Neste caso, dizemos
ser plurimodal, caso contrário será unimodal, ou ainda, amodal (quando todos os
valores das variáveis em estudo apresentarem uma mesma freqüência).
Exemplo 08:
Solução:
4
O conjunto A não tem moda, é chamado de “conjunto amodal”.
O conjunto B tem uma moda Mo = 10, é também chamado de “conjunto unimodal”
O conjunto C tem Mo = 100 e Mo = 200, é chamada de “conjunto binmodal” ou
99
“plurimodal”
Exemplo 09:
Exemplo 11:
Fi
moda).
Neste caso, a moda não é percebida tão facilmente como nos casos anteriores, para
tal, utilizaremos dois processos na sua obtenção.
? ?
1
?
Mo ?
li ?
? ? ?
h
?
?1?
? 1?
Onde:
Mo ? Moda
?1 - freqüência da classe modal - freqüência da classe vizinha anterIor (?1 ?? Fmáx Fant )
?2 - freqüência da classe modal - freqüência da classe vizinha posterior (? 2 =Fmáx
?
Fpost )
h - amplitude do intervalo de classe
li - limite inferior da classe modal
Exemplo 12
Classe Freqüência
?3 ?
?
1 ?
6?3; ?
3? 2 ?
6?4 ; Li = 20; h = 10 ?
2? Mo ?
20 ?
?? 10 ?
Mo = 24,3
3?
? 4?
Exemplo - 13
?2 ?
Li = 20; Fpost = 2; Fant = 3; h = 10 ?
Mo ?
20 ?
?? 10 ?
Mo = 24
3?
? 2?
N° de acidentados 0 1 2 3 4
N° dias 20 15 10 5 3
Pede-se:
UPE - Universidade de Pernambuco
a) Determinar a média;
b) Determinar a mediana;
c) Calcular a moda;
d) Qual a porcentagem de dias em que tivemos dois ou mais acidentes?
Introdução
I) A diferença entre o maior e o menor valor (também cha- mada Amplitude Total);
II) O maior e o menor valor no grupo.
5
106 Consideremos estes três valores: 1, 10 e 25. A diferença entre o valor maior e o
menor é: 25 1 = 24. Alternativamente, pode se dizer que o intervalo de valores vai
NEED - Núcleo de Estudo em Educação a Distância
de 1 à 25.
Exemplos:
3) O intervalo (AT) da distribuição: 3,2; 4,7; 5,6; 2,1; 1,9; 10,3; é: 10,3 1,9 = 8,4
Ela é obtida pela diferença entre os limites superior e inferior dessa classe, e é
indicada por
hi . Assim: hi ? li , onde:
Li ?
Tabela.1
1 150 ?
154 4
2 154 ?
158 9
3 158 ?
162 11
4 162 ?
166 8
5 166 ?
170 5
6 170 ?
174 3
?
?40
Temos: h1 ?154 ?150 ?h1 ?4cm
h7 ?174 ?170 ?h7 ?4cm
mínimo)
AT ?
L( máx ) ?
l ( mín )
Exemplo:
Amplitude Amostral
AA ?
x( máx ) ?
x( mín )
Exemplo:
Na distribuição da amostra:
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
Temos: AA ?
173 ?
150 ?
23 ?
AA ?
23
x1 ?
x ?
x2 ? ?
x ??xn ?
x ? xi ?
x 5
i?
1
Dm ? ou Dm ? , onde n é o número de
n n
109
observações do conjnto.
Para o cálculo do desvio médio são tomados os módulos dos desvios, pois a
soma dos desvios é zero.
Exemplos:
1) Calcular o desvio médio da distribuição: 7, 10, 12, 15, 16, 18, 20.
Resolução:
7?
14 ?
10 ?
14 ?
12 ?
14 ?
15 ?14 ?
16 ?
14 ?
18 ?
14 ?
20 ?
14
Dm ?
7
7?
4?
2?
1?2?
4?
6 26
? ?? 3,42
7 7
UPE - Universidade de Pernambuco
Resolução:
2?
4?
6?8?
10
X ? ?
6
i. Determinemos a média: 5
xi ?
x
5 2 -- 6 = -- 4
4 – 6 = -- 2
110 6–6 = 0
8–6 = 2
NEED - Núcleo de Estudo em Educação a Distância
10 – 6 = 4
xi ?
x 12
4?
2?
0?
2?
4? ?
12 ?xi ?
x . Logo; Dm ?
n
?
5
?
2,4
Resolução:
1?
2? 3? 4?
5 15
X ? ? ?3
5 5
?xi ? x 1?
?
3? 2? 3?
3? 3?
4?
3?
5?
3 2?
?
1?
0?1?
2 6
? ?
1,2
n 5 5 5
Variância
Assim, se x1 , x 2 , x3 ,?
xn , é uma amostra de n elementos da variável xi , então:
n
2
?
(x ?
x)i
S2 ?
i?
1
n
e para dados tabulados a variância é dada por: 5
n 111
∑ x)2. fi
( xi −
Observações:
n?
1
Exemplos:
UPE - Universidade de Pernambuco
Resolução:
5
112
n
i?
1
?
x
7?
i
10 ?
12 ?
15 ?
16 ?
18 ?
20 98
x? ? ? ?
14
NEED - Núcleo de Estudo em Educação a Distância
n 7 7
14) 2 ?
(7 ? 14) 2 ?
(10 ? 14) 2 ?
(12 ? 14) 2 ?
(15 ? 14) 2 ?
(16 ? 14) 2 ?
(18 ? 14) 2
(20 ?
S2 ?
7?1
7) 2 ?
(? 4) 2 ?
(? 2) 2 ?
(? 12 ?
22 ?
42 ?
6 2 126
= ?? 21
6 6
3
2) Ao se cultivar o peixe tambaqui, a 60ind/m / 120 dias, criados em gaiolas de
1,0 m3, obtiveram-se os seguintes pesos (g):
Gaiola/1 Gaiola/2
350,3 342,3 352,8 345,9 340,7 350,1 350,1 331,7 334,1 350,9
328,4 345,8 334,1 360,6 356,6 349,9 348,7 345,1 348,0 348,9
X ?
345,75 g
X?
345,75 g
Observe que as médias dos pesos dos peixes das gaiolas 1 e 2 são iguais,
evidenciando que apenas a média não é suficiente para diferenciar qual dos dois
cultivos gerou peixes de melhor ou pior crescimento em peso. Dessa forma, faz-se
necessário conhecer a variância, para um melhor diagnóstico.
345,75) 2 +
(350,3 − 345,75) 2 +
(342,3 − 345,75) 2 +
(352,8 − L+ 345,75) 2
(356,6 −
=
98,09 g
10 −1
Gaiola/2
345,75) 2 ?
(350,1 ? 345,75) 2 ?
(350,1 ? 345,75) 2 ?
(331,7 ? ?? 345,75) 2
(348,9 ?
?
48,76 g 5
10 ?1
113
Como a variância da gaiola 2 foi menor do que a da gaiola 1, pode-se concluir que o
Resolução:
7?
10 ?
12 ?
15 ?
16 ?
18 ?
20 98
X ? ?? 14
7 7
xi ( xi ?
x) x)2
( xi ?
7 --7 49
10 --4 16
12 --2 4
15 1 1
16 2 4
18 4 16
20 6 36
2
?
(x ?
x) ?
126i
UPE - Universidade de Pernambuco
n
2
?
(x ?
x) .
126 i
Portanto, S2 ?
i?
1
S 2 ??
? 21
n?
1 6
Resolução:
5
114 2?
X ?
4?
6?8?
10 30
?? 6
5 5
NEED - Núcleo de Estudo em Educação a Distância
xi ( xi ?
x) x)2
( xi ?
2 --4 16
4 --2 4
6 0 0
8 2 4
10 4 16
2
?
(x ?
x) ?
40i
n
2
?
(x ?
x) . i
40
Logo; S2 ?
i?
1
S 2 ??
? 10
n?
1 4
5) Determine a variância dos dados: 1, 3, 4, 3, 4, 2, 4, 1, 2, 2, 1, 0
Resolução:
1?
3?
4?
3?
4?
2? 4?
1?
2?
2?
1?
0 27
X ? ?? 2,25
12 12
?
(x ?
x) ? 2
20,25
i
5
115
Desvio Padrão
Desta forma, se x1 , x 2 , x3 ,?
xn é uma amostra de n elementos da variável xi , então o
?? x?
x ? i
2
desvio padrão é S? .
n?
1
Exemplos:
Resolução:
20 ?
5?
10 ?
15 ?
25 75
X ? ?? 15
5 5
UPE - Universidade de Pernambuco
xi ( xi ?
x) x)2
( xi ?
20 5 25
5 -10 100
10 -5 25
15 0 0
25 10 100
2
?
(x ?
ix) ?
250
?? x?
x ? 250i
2
Portanto, S ? ? ? 62,5 ?
7,91
5 n?
1 4
116 2) Sendo a variância de uma amostra igual a 81, calcule o desvio padrão dessa
amostra.
NEED - Núcleo de Estudo em Educação a Distância
Resolução:
O desvio padrão é uma das medidas mais comumente usadas para distribuições, e
desempenha papel relevante em toda a estatística.
Cabe notar que a unidade do desvio padrão é a mesma da média. Por exemplo, se a
média é em dólar, o desvio padrão também é em dólar.
Exercícios:
?
?40
Responda:
5
a. Qual a amplitude amostral? 117
b. Qual a amplitude de distribuição?
Pede-se:
a. Calcular o desvio médio absoluto;
b. Calcular a variância;
c. Calcular o desvio-padrão.
6 9 2 7 0 8 2 5 4 1
5 4 1 4 4 2 5 6 3 7
Pede-se:
8) O desvio padrão pode ser zero? Explique. Pode ser negativo? Explique.
Bibliografia (Básica):