1 - Introdução A Estatística

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 34

Introdução à Estatística

A palavra estatística lembra, à maioria das pessoas, recenseamento. Os


censos existem há milhares de anos e constituem um esforço imenso e caro
feito pelos governos, com o objetivo de conhecer seus habitantes, sua
condição socioeconômica, sua cultura, religião, etc. Portanto, associar
estatística a censo é perfeitamente correto do ponto de vista histórico, sendo
interessante salientar que as palavras estatística e estado têm a mesma origem
latina: status.
A estatística é também comumente associada às pesquisas de opinião
pública, aos vários índices governamentais, aos gráficos e às médias
publicados diariamente na imprensa. Na realidade, entretanto, a estatística
engloba muitos outros aspectos, sendo fundamental na análise de dados
provenientes de quaisquer processos onde exista variabilidade.
É possível distinguir duas concepções para a palavra ESTATÍSTICA: no
plural (estatísticas), indica qualquer coleção de dados numéricos, reunidos com
a finalidade de fornecer informações acerca de uma atividade qualquer. Assim,
por exemplo, as estatísticas demográficas referem-se aos dados numéricos
sobre nascimentos, falecimentos, matrimônios, desquites, etc. As estatísticas
econômicas consistem em dados numéricos relacionados com emprego,
produção, vendas e com outras atividades ligadas aos vários setores da vida
econômica. No singular (Estatística), indica a atividade humana especializada
ou um corpo de técnicas, ou ainda uma metodologia desenvolvida para a
coleta, a classificação, a apresentação, a análise e a interpretação de dados
quantitativos e a utilização desses dados para a tomada de decisões.

Importância da Estatística

O mundo está repleto de problemas. Para resolvermos a maioria deles,


necessitamos de informações. Mas, que tipo de informação? Que quantidade
de informações? Após obtê-las, que fazer com elas? A Estatística trabalha com
essas informações, associando os dados ao problema, descobrindo como e o
que coletar, assim capacitando o pesquisador (ou profissional ou cientista) a
obter conclusões a partir dessas informações, de tal forma que possam ser
entendidas por outras pessoas.
Portanto, os métodos estatísticos auxiliam o cientista social, o
economista, o engenheiro, o agrônomo e muitos outros profissionais a
realizarem o seu trabalho com mais eficiência.

A Estatística é uma parte da Matemática que fornece métodos para a


coleta, organização, descrição, análise e interpretação de dados, viabilizando a
utilização dos mesmos na tomada de decisões.

Vejamos alguns exemplos:


• Os estatísticos do governo conduzem censos de população, moradia,
produtos industriais, agricultura e outros. São feitas compilações sobre
vendas, produção, inventário, folha de pagamento e outros dados das
indústrias e empresas. Essas estatísticas informam ao administrador como
a sua empresa está crescendo, seu crescimento em relação a outras
empresas e fornece-lhe condições de planejar ações futuras. A análise dos
dados é muito importante para se fazer um planejamento adequado.
• Na era da energia nuclear, os estudos estatísticos têm avançado
rapidamente e, com seus processos e técnicas, têm contribuído para a
organização de empresas e utilização dos recursos do mundo moderno.
Em geral, as pessoas, quando se referem ao termo estatística,
desconhecem que o aspecto essencial é o de proporcionar métodos
inferenciais, que permitam conclusões que transcendam os dados obtidos
inicialmente.

Grandes áreas da Estatística

Para fins de apresentação, é usual se dividir a estatística em três


grandes áreas, embora não se trate de ramos isolados:
• Estatística Descritiva e Amostragem – Conjunto de técnicas que
objetivam coletar, organizar, apresentar, analisar e sintetizar os dados
numéricos de uma população, ou amostra;
• Estatística Inferencial – Processo de se obter informações sobre uma
população a partir de resultados observados na amostra;
• Probabilidade - Modelos matemáticos que explicam os fenômenos
estudados pela Estatística em condições normais de experimentação.
• Em estatística, utilizamos extensamente os termos: população, amostra,
censo, parâmetros, estatística, dados discretos, dados contínuos, dados
quantitativos e dados qualitativos; que estaremos definindo abaixo para
maior compreensão:
• População: é uma coleção completa de todos os elementos a serem
estudados.
• Amostra: é uma subcoleção de elementos extraídos de uma população.
• Censo: é uma coleção de dados relativos a todos os elementos de uma
população.
• Parâmetros: é uma medida numérica que descreve uma característica
de uma população.
• Estatística: é uma medida numérica que descreve uma característica de
uma amostra.
• Dados contínuos: resultam de um número infinito de valores possíveis
que podem ser associados a pontos em uma escala contínua de tal
maneira que não haja lacunas.
• Dados discretos: resultam de um conjunto finito de valores possíveis, ou
de um conjunto enumerável de valores.
• Dados quantitativos: consistem em números que representam contagens
ou medidas.
• Dados qualitativos: podem ser separados em diferentes categorias que
se distinguem por alguma característica não-numérica.

Amostragem
É o processo de escolha da amostra. É a parte inicial de qualquer estudo
estatístico. Consiste na escolha criteriosa dos elementos a serem submetidos
ao estudo. Geralmente, as pesquisas são realizadas através de estudo dos
elementos que compõem uma amostra, extraída da população que se pretende
analisar.

Exemplo: Pesquisas sobre tendências de votação


Em épocas de eleição, é comum a realização de pesquisas com o
objetivo de se conhecer as tendências do eleitorado. Para que os resultados
sejam de fato representativos, toma-se o cuidado de se entrevistar um conjunto
de pessoas com características socioeconômicas, culturais, religiosas, etc. tão
próximas quanto possível da população à qual os resultados da pesquisa serão
estendidos. A escolha da amostra, a redação do questionário, a entrevista, a
codificação dos dados e a apuração dos resultados são as etapas deste tipo de
pesquisa.

População e amostra

O estudo de qualquer fenômeno, seja ele natural, social, econômico ou


biológico, exige a coleta e a análise de dados estatísticos. A coleta de dados é,
pois, a fase inicial de qualquer pesquisa.
É sobre os dados da amostra que se desenvolvem os estudos, visando a
fazer inferências sobre a população.

Exemplo: Avaliação de um programa de ensino


Toma-se certo número de pares de turmas: a um conjunto de turmas
ensina-se um assunto por um novo método e, ao outro, pelo método clássico.
Aplica-se uma prova a ambos os grupos. As notas observadas nesses
conjuntos de turmas constituem a nossa amostra. Se os resultados do novo
método forem melhores, iremos aplicá-lo a todas as turmas, isto é, à
população. A partir da amostra, estabelecemos o que é conveniente para a
população, ou seja, fazemos uma inferência sobre a população.
Exemplo: Renda média per capita em diversas regiões do país
Toma-se um conjunto de indivíduos em cada região, escolhidos ao
acaso, e sobre esse grupo são feitos os estudos. Os indivíduos assim
escolhidos constituem a amostra e os resultados nela observados serão
estendidos à população.

Estatística Descritiva

É a parte mais conhecida. Quem vê o noticiário, na televisão ou nos


jornais, sabe quão frequente é o uso de médias, índices e gráficos nas notícias.
Exemplo: INPC (Índice Nacional de Preços ao Consumidor)
Sua construção envolve a sintetização, em um único número, dos
aumentos dos produtos de uma cesta básica.
Exemplo: Anuário Estatístico Brasileiro
O IBGE publica esse anuário apresentando, em várias tabelas, os mais
diversos dados sobre o Brasil: educação, saúde, transporte, economia, cultura,
etc. Embora simples, fáceis de serem entendidas, as tabelas são o produto de
um processo demorado e extremamente dispendioso de coleta e apuração de
dados.
Exemplo: Anuário Estatístico da Embratur
A Embratur publica esse anuário apresentando, em várias tabelas e
gráficos, os mais diversos dados sobre Turismo Interno e dados sobre entrada
de turistas estrangeiros no Brasil.

Estatística Inferencial (ou Indutiva)

A tomada de decisões sobre a população, com base em estudos feitos


sobre os dados da amostra, constitui o problema central da inferência
estatística.
Exemplo: Suponha que a distribuição das alturas de todos os habitantes
de um país possa ser representada por uma distribuição normal. Mas não
conhecemos de antemão a média da distribuição. Devemos, pois, estimá-la.
Exemplo: Análise financeira. Os analistas financeiros estudam dados
sobre a situação da economia, visando explicar tendências dos níveis de
produção e de consumo, projetando-os para o futuro.
Exemplo: Ocorrência de terremotos. Os geólogos estão continuamente
coletando dados sobre a ocorrência de terremotos. Gostariam de inferir quando
e onde ocorrerão tremores, e qual a sua intensidade. Trata-se, sem dúvida, de
uma questão complexa, que exige longa experiência geológica, além de
cuidadosa aplicação de métodos estatísticos.

Probabilidade

O processo de generalização, que é característico do método indutivo,


está associado a uma margem de incerteza. A existência da incerteza deve-se
ao fato de que a conclusão, que se pretende obter para o conjunto de todos os
indivíduos analisados quanto a determinadas características comuns, baseia-
se em uma parcela do total das observações. A medida da incerteza é tratada
mediante técnicas e métodos que se fundamentam na Teoria da Probabilidade.
Essa teoria procura quantificar a incerteza existente em determinada situação.

Fases do Método Estatístico

Quando se pretende empreender um estudo estatístico completo,


existem diversas fases do trabalho que devem ser desenvolvidas para se
chegar aos resultados finais de um estudo capaz de produzir resultados
válidos. As fases principais são as seguintes:
• Definição do problema
• Planejamento
• Coleta de dados
• Apuração dos dados
• Apresentação dos dados
• Análise e Interpretação dos dados
Definição do problema

A primeira fase do trabalho consiste em uma definição ou formulação


correta do problema a ser estudado. Além de considerar detidamente o
problema objeto do estudo, o analista deverá examinar outros levantamentos
realizados no mesmo campo e que sejam análogos, uma vez que parte da
informação de que se necessita pode, muitas vezes, ser encontrada nesses
últimos.

Planejamento

O passo seguinte, após a definição do problema, compreende a fase do


planejamento, que consiste em se determinar o procedimento necessário para
se resolver o problema e, em especial, como levantar informações sobre o
assunto, objeto do estudo. É preciso planejar o trabalho a ser realizado tendo
em vista o objetivo que se pretende atingir. É nessa fase que será escolhido o
tipo de levantamento a ser utilizado. Sob esse aspecto, pode haver dois tipos
de levantamento:
• Levantamento censitário, quando a contagem for completa, abrangendo
todo o universo;
• Levantamento por amostragem, quando a contagem for parcial.
• Outros elementos importantes que devem ser tratados nesta mesma
fase são:
• Cronograma das atividades, através do qual são fixados os prazos para
as várias fases;
• Custos envolvidos;
• Exame das informações disponíveis;
• Delineamento da amostra, etc.

Coleta dos dados


O terceiro passo é essencialmente operacional, compreendendo a coleta
das informações propriamente ditas. Nesta fase do método estatístico, é
conveniente estabelecer uma distinção entre duas espécies de dados:
• Dados primários – quando são publicados ou coletados pelo próprio
pesquisador ou organização que os escolheu;
• Dados secundários – quando são publicados ou coletados por outra
organização.
Um conjunto de dados é, pois, primário ou secundário em relação a
alguém. As tabelas do Censo Demográfico são fontes primárias. Quando
determinado jornal publica estatísticas extraídas de várias fontes e
relacionadas com diversos setores industriais, os dados são secundários para
quem desejar utilizar-se deles em alguma pesquisa que esteja desenvolvendo.
A coleta de dados pode ser realizada de duas maneiras:
• Coleta Direta – quando é obtida diretamente da fonte, como no caso da
empresa que realiza uma pesquisa para saber a preferência dos
consumidores pela sua marca;
• Coleta Indireta – quando é inferida a partir dos elementos conseguidos pela
coleta direta, ou através do conhecimento de outros fenômenos que, de
algum modo, estejam relacionados com o fenômeno em questão.

Apuração dos dados

Antes de começar a analisar os dados, é conveniente que lhes seja dado


algum tratamento prévio, a fim de torná-los mais expressivos. A quarta etapa
do processo é, então, a da apuração ou sumarização, que consiste em resumir
os dados através de sua contagem e agrupamento. Pode ser manual,
eletromecânica ou eletrônica.

Apresentação dos dados

Por mais diversa que seja a finalidade, os dados devem ser


apresentados sob forma adequada, tornando mais fácil o exame do fenômeno
que está sendo objeto de tratamento estatístico.
Há duas formas de apresentação ou exposição dos dados observados,
que não se excluem mutuamente:
• Apresentação tabular – É uma apresentação numérica dos dados. Consiste
em dispor os dados em linhas e colunas distribuídas de modo ordenado,
segundo algumas regras práticas adotadas pelos diversos sistemas
estatísticos. As tabelas têm a vantagem de conseguir expor, sinteticamente
e em só local, os resultados sobre determinado assunto, de modo a se
obter uma visão global mais rápida daquilo que se pretende analisar.
• Apresentação gráfica – É uma apresentação geométrica dos dados
numéricos. Embora a apresentação tabular seja de extrema importância no
sentido de facilitar a análise numérica de dados, não permite ao analista
obter uma visão tão rápida, fácil e clara do fenômeno e sua variação como
aquela conseguida através de um gráfico.

Análise e interpretação dos dados

Nesta última etapa, o interesse maior reside em tirar conclusões que


auxiliem o pesquisador a resolver seu problema. A análise dos estatísticos está
ligada essencialmente ao cálculo de medidas, cuja finalidade principal é
descrever o fenômeno. Assim, o conjunto de dados a ser analisado pode ser
expresso por números resumo, as estatísticas que evidenciam as
características particulares desse conjunto. O significado exato de cada um dos
valores obtidos através do cálculo das várias medidas estatísticas disponíveis
deve ser bem interpretado. É possível mesmo, nesta fase, arriscar algumas
generalizações, as quais envolverão, como mencionado anteriormente, algum
grau de incerteza, porque não se pode estar seguro de que o que foi
constatado para aquele conjunto de dados (a amostra) se verificará igualmente
para a população.

Séries Estatísticas
Define-se série estatística como toda e qualquer coleção de dados
estatísticos referidos a uma mesma ordem de classificação: quantitativa. No
sentido mais amplo, série é uma sucessão de números referidos a qualquer
variável. Se os números expressarem dados estatísticos, a série será chamada
de série estatística.
Em sentido mais restrito, pode-se dizer que uma série estatística é uma
sucessão de dados estatísticos referidos a caracteres qualitativos, ao passo
que uma sucessão de dados estatísticos referidos a caracteres quantitativos
configurará uma Distribuição de Frequência.
Em outros termos, a palavra série é usada normalmente para designar
um conjunto de dados dispostos de acordo com um caráter variável, residindo
a qualidade serial na disposição desses valores, e não em uma disposição
temporal ou espacial de indivíduos.
Tabela é um quadro que resume um conjunto de observações.
Uma tabela compõe-se de:
• Corpo – conjunto de linhas e colunas que contém informações sobre a
variável em estudo;
• Cabeçalho – parte superior da tabela que especifica o conteúdo das
colunas;
• Coluna indicadora – parte da tabela que especifica o conteúdo das
linhas;
• Linhas – retas imaginárias que facilitam a leitura, no sentido horizontal,
de dados que se inscrevem nos seus cruzamentos com as colunas;
• Casa ou célula – espaço destinado a um só número;
• Título – conjunto de informações, as mais completas possíveis,
respondendo às perguntas: O quê? - Quando? - Onde? - localizado no
topo da tabela.
• Fonte – referência de onde se obteve os dados, colocado, de
preferência, no rodapé.
• As tabelas servem para apresentar séries estatísticas. Conforme varie
um dos elementos da série, podemos classificá-la em:
• Cronológicas - Tempo (fator temporal ou cronológico) – a que época se
refere o fenômeno analisado;
• Geográficas - Local (fator espacial ou geográfico) – onde o fenômeno
acontece;
• Específicas - Fenômeno (espécie do fato ou fator especificativo) – o que
é descrito.
As séries também são divididas em:
• Séries Homógradas - aquelas em que a variável descrita apresenta variação
discreta ou descontínua. São séries homógradas a série temporal, a série
geográfica e a série específica;
• Séries Heterógradas - aquelas nas quais o fenômeno ou o fato apresenta
graduações ou subdivisões. Embora fixo, o fenômeno varia em intensidade.
A Distribuição de frequências ou seriação é uma série heterógrada.
Os dados estatísticos resultantes da coleta direta da fonte, sem outra
manipulação senão a contagem ou medida, são chamados dados absolutos.
Dados Relativos são o resultado de comparações por quociente (razões) que
se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar
as comparações entre quantidades.

Tipos de Séries Estatísticas Simples (ou de uma entrada)

As séries estatísticas diferenciam-se de acordo com a variação de um


dos três elementos: tempo, local e fenômeno.

Série Cronológica

Também chamada de série temporal, série histórica, série evolutiva ou


marcha, identifica-se pelo caráter variável do fator cronológico. Assim, deve-se
ter:
Elemento variável: Época
Elementos Fixos: Local e Fenômeno
Exemplo:
Tabela 1.1 - Operadora WKX – Venda de bilhetes aéreos
– Mercado Interno – 1995
Meses Vendas (em milhares de reais)

Janeiro 2300

Fevereiro 1800
Março 2200
Abril 2210
Maio 2360
Junho 2600
Julho 2690
Agosto 3050
Setembro 3500
Outubro 3440
Novembro 3100
Dezembro 2760
TOTAL ANUAL 31510

Fonte: Departamento de Análise de Mercado

Série Geográfica

Também chamada de série territorial, série espacial ou série de


localização, identifica-se pelo caráter variável do fator geográfico. Assim, deve-
se ter:
Elemento variável: Local
Elementos Fixos: Época e Fenômeno Exemplo:
Tabela 1.2 – Operadora WKX - Vendas por Unidade da Federação –
1995

Unidades da Federação Vendas (em milhares de reais)

Minas Gerais 4000

Paraná 2230

Rio Grande do Sul 6470

Rio de Janeiro 8300

São Paulo 10090

Outros 420
TOTAL BRASIL 31510

Fonte: Departamento de Análise de Mercado

Série Específica
Também chamada de série categórica ou série por categoria, identifica-
se pelo caráter variável de fator especificativo. Assim, deve-se ter:
Elemento variável: Fenômeno
Elementos Fixos: Local e Época
Exemplos:
Tabela 1.3.– Operadora WKX -
Venda de bilhetes aéreos por Linha – 1995

Linha do Produto Vendas (em milhares de reais)

Linha A 6450

Linha B 9310

Linha C 15750

TODAS AS LINHAS 31510

Fonte: Departamento de Análise de Mercado


Tabela 1.4. Número de empregados das várias classes de salários no
estado de São Paulo – 1998

Classes de Salários (R$) Número de Empregados

Até 80 41 326

De 80 a 119 123 236

De 120 a 159 428 904

De 160 a 199 324 437

De 200 a 399 787 304

De 400 a 599 266 002

De 600 a 799 102 375

De 800 a 999 56 170

1000 e mais 103 788

TOTAL 2 233 542


Fonte: Serviço de Estatística da Previdência e Trabalho
(Dados alterados para melhor compreensão)

Tabelas Compostas (ou de dupla entrada)


As tabelas apresentadas anteriormente são tabelas estatísticas simples,
onde apenas uma série está representada. É comum, todavia, haver
necessidade de apresentar, em uma única tabela, mais do que uma série.
Quando as séries aparecem conjugadas, tem-se uma tabela de dupla entrada.
Em uma tabela desse tipo são criadas duas ordens de classificação: uma
horizontal (linha) e uma vertical (coluna).
Exemplos:
a) Série específico-temporal
b) Série geográfico-temporal
Tabela 1.5 – População economicamente ativa por setor de atividades –
Brasil

Setor População (1 000 Hab.)

1940 1950 1960

Primário 8 968 10 255 12 163

Secundário 1 414 2 347 2 962

Terciário 3 620 4 516 7 525

Fonte: IPEA
Tabela 1.6 – População Indígena Brasileira

Unidade de Produção
Produção 1937 1938 1939

Acre 5 007 4 765 4 727

Amazonas 6 858 5 998 5 631

Pará 4 945 4 223 4 500

Mato Grosso 1 327 1 285 1 235

Outros Estados 333 539 337

Fonte: Anuário Estatístico do Brasil – IBGE - (Dados alterados para


melhor compreensão)
Podem existir, se bem que mais raramente, pela dificuldade de
representação, séries compostas de três ou mais entradas.

Observação:
Nem sempre uma tabela representa uma série estatística. Por vezes, os
dados reunidos não revelam uniformidade, sendo meramente um aglomerado
de informações gerais sobre determinado assunto, as quais, embora úteis, não
apresentam a consistência necessária para se configurar uma série estatística.
Exemplo: Tabela com resumos de dados, mas que não representa uma
série estatística.
Tabela 1.8 – Situação dos espetáculos cinematográficos no Brasil –
1967

Especificação Dados Numéricos

Número de cinemas 2 488

Lotação dos cinemas 1 722 348

Sessões por dia 3 933

Filmes de longa metragem 131 330 488

Meia-entrada 89 581 234

Fonte: Anuário Estatístico do Brasil – IBGE

Apresentação de dados - Tabelas e Gráficos: Construção e


Interpretação
A representação gráfica das séries estatísticas tem por finalidade
representar os resultados obtidos, permitindo que se chegue a conclusões
sobre a evolução do fenômeno ou sobre como se relacionam os valores da
série. A escolha do gráfico mais apropriado ficará a critério do analista.
Contudo, os elementos simplicidade, clareza e veracidade devem ser
considerados, quando da elaboração de um gráfico.
• Simplicidade – o gráfico deve ser destituído de detalhes de importância
secundária, assim como de traços desnecessários que possam levar o
observador a uma análise morosa ou sujeita a erros.
• Clareza – o gráfico deve possibilitar uma correta interpretação dos valores
representativos do fenômeno em estudo.
• Veracidade – o gráfico deve expressar a verdade sobre o fenômeno em
estudo.
Diretrizes para a construção de um gráfico:
O título do gráfico deve ser o mais claro e completo possível. Quando
necessário, deve-se acrescentar subtítulos;
A orientação geral dos gráficos deve ser da esquerda para a direita;
As quantidades devem ser representadas por grandezas lineares;
Sempre que possível, a escala vertical há de ser escolhida de modo a
aparecer a linha 0 (zero);
Só devem ser incluídas no desenho as coordenadas indispensáveis
para guiar o olhar do leitor ao longo da leitura. Um tracejado muito cerrado
dificulta o exame do gráfico;
A escala horizontal deve ser lida da esquerda para a direita, e a vertical
de baixo para cima;
Os títulos e marcações do gráfico devem ser dispostos de maneira que
sejam facilmente lidos, partindo da margem horizontal inferior ou da margem
esquerda.
Leitura e interpretação de um gráfico:
Declarar qual o fenômeno ou fenômenos representados, a região
considerada, o período de tempo, a fonte dos dados, etc.;
Examinar o tipo de gráfico escolhido, verificar se é o mais adequado,
criticar a sua execução, no conjunto e nos detalhes;
Analisar cada fenômeno separadamente, fazendo notar os pontos mais
em evidência, o máximo e o mínimo, assim como as mudanças mais bruscas;
Investigar se há uma “tendência geral” crescente ou decrescente ou,
então, se o fato exposto é estacionário;
Procurar descobrir a existência de possíveis ciclos periódicos, qual o
período aproximado, etc.
Eis os tipos mais comuns de gráficos:
Gráfico em Linhas
Constitui uma aplicação do processo de representação das funções num
sistema de coordenadas cartesianas
Exemplo: Vendas em Cr$ 1000,00 nos anos de 1971 a 1977 de
determinado produto da empresa x.

Vendas em Cr$ 1000,00

500

400

300

200

100

0
1971 1972 1973 1974 1975 1976 1977
anos

Fonte: Dados Fictícios.

Gráfico em Colunas
É a representação de uma série por meio de retângulos, dispostos
verticalmente. Exemplo: População Brasileira nas décadas de 40 a 70.

População

100

80

60
População
40

20

0
1940 1950 1960 1970

Fonte: Dados Fictícios


Gráfico em Barras
É semelhante ao gráfico em colunas, porém, os retângulos são
dispostos horizontalmente.
Exemplo: População Brasileira nas décadas de 40 a 70

População do Brasil

1970

1960
População do
1950 Brasil

1940

0 20 40 60 80 100

Fonte: Dados Fictícios

Gráfico em Setores

É a representação gráfica de uma série estatística em círculo, por meio


de setores. É utilizado principalmente quando se pretende comparar cada valor
da série com o total.
Exemplo:
Receita (em R$ 1.000.000,00) do Município X de 1975-77

Anos Receita (em R$ 1.000.000,00)

1975 90

1976 120

1977

Total

Fonte: Departamento da Fazenda, Município X.


O total é representado pelo círculo, que fica dividido em tantos setores
quantas são as partes. Os setores são tais que suas áreas são
respectivamente proporcionais aos dados da série.
Obtemos cada setor por meio de uma regra de três simples e direta,
lembrando que o total da série corresponde a 360º.

Total __________360º
Parte___________ xº

Para 1975: 360 - 360º Para 1976: 360 - 360º Para 1977: 360 - 360º
90 - xº 120 - xº 150 - xº
x = 90º x = 120º x = 150º

Receita do Municipio X

1975
1976
1977

Fonte: Departamento da Fazenda, Município X

Gráfico Polar
É o gráfico ideal para representar séries temporais cíclicas, isto é, séries
que apresentam em seu desenvolvimento determinada periodicidade, como,
por exemplo, a variação da precipitação pluviométrica ao longo do ano, ou da
temperatura ao longo do dia, o consumo de energia elétrica durante o mês ou o
ano, etc.
Exemplo:
Movimento Mensal de Compras de uma agencia em 1972
Meses Valores (R$1.000,00)

Janeiro 12

Fevereiro 13

Março 14

Abril 12

Maio 15

Junho 19

Julho 17

Agosto 18

Setembro 14

Outubro 16

Novembro 12

Dezembro 18

Fonte: Departamento financeiro da Agência (dados Fictícios)


Movimento Mensal de Compras de uma agencia em 1972

Jan
20
Dez Fev
15
Nov 10 Mar
5
Out 0 Abr

Set Mai

Ago Jun
Jul

Fonte: Departamento financeiro da Agência

Amostragem

Veremos quais as técnicas que podemos utilizar para compor uma


amostra.
Importância da Amostragem

Na realização de qualquer estudo, quase nunca é possível examinar


todos os elementos da população de interesse. Temos usualmente que
trabalhar com uma amostra da população. A inferência estatística nos dá
elementos para generalizar, de maneira segura, as conclusões obtidas da
amostra para a população. Mas, para as inferências serem corretas, é
necessário garantir que a amostra seja representativa da população, isto é, a
amostra deve possuir as mesmas características básicas da população no que
diz respeito ao fenômeno pesquisado.
É errôneo pensar que, caso tivéssemos acesso a todos os elementos da
população, seríamos mais precisos. Os erros de coleta e manuseio de um
grande número de dados são maiores do que as imprecisões a que estamos
sujeitos quando generalizamos, via inferência, as conclusões de uma amostra
bem selecionada.
Em se tratando de amostra, a preocupação central é que ela seja
representativa. É preciso que a amostra, ou as amostras que vão ser usadas
sejam obtidas por processos adequados.
Assim que decidimos obter informações através de um levantamento
amostral, temos imediatamente dois problemas:
• Definir cuidadosamente a população de interesse;
• Selecionar a característica que iremos pesquisar.
• Dados coletados de forma descuidada podem ser tão inúteis que
nenhum processamento estatístico consegue salvá-los.

Conceitos Fundamentais

O conceito de população é intuitivo; trata-se do conjunto de indivíduos


ou objetos que apresentam em comum determinadas características definidas
para o estudo.
• Amostra- é um subconjunto da população.
• Amostragem- são procedimentos para extração de amostras que
representem bem a população.
• Riscos- é a margem de erro motivado pelo fato de investigarmos
parcialmente (amostras) o universo (população).
• População-alvo- é a população sobre a qual vamos fazer inferências
baseadas na amostra.
Para que possamos fazer inferências válidas sobre a população a partir
de uma amostra, é preciso que essa seja representativa. Uma das formas de
se conseguir representatividade é fazer com que o processo de escolha da
amostra seja, de alguma forma, aleatório. Além disso, a aleatoriedade permite
o cálculo de estimativas dos erros envolvidos no processo de inferência.
Quanto à extração dos elementos, as amostras podem ser:
• Com reposição - quando um elemento sorteado puder ser sorteado
novamente;
• Sem reposição - quando o elemento sorteado só puder figurar uma única
vez na amostra.
Basicamente, existem dois métodos para composição da amostra:
probabilístico e não probabilístico (intencional).
• O método de amostragem probabilística exige que cada elemento da
população possua determinada probabilidade de ser selecionado.
Normalmente, possuem a mesma probabilidade. Assim, se N for o tamanho
da população, a probabilidade de cada elemento será 1/N. Somente com
base em amostragens probabilísticas pode-se realizar inferências sobre a
população, a partir dos parâmetros estudados na amostra. São elas:
• Amostragem Aleatória Simples;
• Amostragem Aleatória Estratificada;
• Amostragem Sistemática;
• Amostragem por Conglomerado.
Por serem as principais técnicas estudas, serão mais detalhadamente
exploradas no item 2.3.
• Os métodos não probabilísticos são amostragens em que há uma escolha
deliberada dos elementos que compõem a amostra. Não se pode
generalizar os resultados das pesquisas para a população, uma vez que as
amostras não probabilísticas não garantem a representatividade da
população. São elas:
• Amostragem Acidental;
• Amostragem Intencional;
• Amostragem por Quotas.
Amostragem Acidental - É formada por elementos que vão aparecendo,
que são possíveis de se obter até completar o número de elementos da
amostra.
Ex: Pesquisa de opinião, em que os entrevistados são acidentalmente
escolhidos.
Amostragem Intencional - É formada por elementos escolhidos por
determinado critério, ou seja, escolhe-se intencionalmente um grupo de
elementos que irão compor a amostra.
Amostragem por Cotas - Classificação da população em termos de
propriedades que se sabe serem relevantes para a característica a ser
estudada. Determinação da proporção da população para cada característica
com base na constituição conhecida, ou estimada, da população. Fixação de
quotas para cada observador, ou entrevistador, a quem tocará a
responsabilidade de selecionar interlocutores ou entrevistados, de modo que a
amostra total observada, ou entrevistada, contenha a proporção de cada
classe.

Amostragem Aleatória Simples

A amostragem aleatória simples é um processo para selecionar


amostras de tamanho “n” dentre as “N” unidades em que foi dividida a
população. Sendo a amostragem realizada sem reposição, que é o caso mais
comum, existem (N,n) possíveis amostras, todas igualmente prováveis. As
amostras aleatórias podem ser escolhidas por diversos métodos, inclusive por
tabelas de números aleatórios (TNA) e de computadores para gerar números
aleatórios Na prática, a amostra aleatória simples é escolhida unidade por
unidade. As unidades da população são numeradas de 1 a N. Em seguida,
escolhe-se, na tabela de números aleatórios (TNA), (ou por computador) n
números compreendidos entre 1 e N. Esse processo é equivalente a um sorteio
no qual se colocam todos os números misturados dentro de uma urna.
As unidades correspondentes aos números escolhidos formarão a
amostra.

Amostragem Aleatória Estratificada


Uma amostra estratificada é obtida separando-se as unidades da
população em grupos não superpostos chamados estratos, e selecionando-se
independentemente uma amostra aleatória simples de cada estrato. Existem
dois tipos de amostragem estratificada:
• De igual tamanho;
• Proporcional.
No primeiro tipo, sorteia-se igual número de elementos em cada estrato.
Esse processo é utilizado quando o número de elementos por estrato for
aproximadamente o mesmo.
No outro caso, utiliza-se a amostragem estratificada proporcional, cujo
processo de calcular o número de amostras por estrato é:
N → Nº de unidades da população
n → Nº de unidades das amostras
Na →Nº de unidades do estrato A
na → Nº de amostras de A

Exemplo:
Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam
meninos e 36 sejam meninas, vamos obter uma amostra proporcional
estratificada de 10%.
Resolução:
• São, portanto, dois estratos (sexo masculino e feminino) e
queremos uma amostra de 10% da população;
• Calcula-se o número de amostras de cada estrato.

Sexo População 10% Número de amostras


M 54 5,4 5

F 36 3,6 4

Total 90 9,0 9

• Numeramos os alunos de 01 a 90, sendo que de 01 a 54


correspondem meninos e de 55 a 90, meninas. O próximo passo é
o mesmo do exemplo anterior.

Amostragem por Conglomerado

Uma amostra por conglomerado é uma amostra aleatória simples na


qual cada unidade de amostragem é um grupo, ou um conglomerado de
elementos.
O primeiro passo na amostragem por conglomerado é especificar
conglomerados apropriados. Os elementos em um conglomerado tendem a ter
características similares, portanto, o fato de novas medidas serem tomadas
num conglomerado não implica necessariamente aumento de informação sobre
o parâmetro populacional. Como regra geral, o número de elementos num
conglomerado deverá ser pequeno em relação ao tamanho da população e o
número de conglomerados deverá ser razoavelmente grande.
Na amostragem por conglomerado a população é dividida em grupos. E
selecionam-se amostras aleatórias simples de grupos e, então, todos os itens
dos grupos (conglomerados) selecionados farão parte da amostra.
Exemplo:
Em um levantamento da população de uma cidade, podemos dispor do
mapa indicando cada quarteirão e não dispor de uma relação atualizada dos
seus moradores. Pode-se, então, colher uma amostra dos quarteirões e fazer a
contagem completa de todos os que residem naqueles quarteirões sorteados.

Amostragem Sistemática
Quando os elementos da população já se encontram ordenados, não há
necessidade de se construir o sistema de referência. Nesses casos, a seleção
dos elementos que constituirão a amostra pode ser por um sistema imposto
pelo pesquisador.
Em geral, para se obter uma amostra sistemática de n elementos de
uma população de tamanho N, K deve ser menor ou igual a N/n. Não é
possível determinar K, precisamente, quando o tamanho da população é
desconhecido, mas pode-se supor um valor de k de tal modo que seja possível
obter uma amostra de tamanho n. Em vez da amostragem aleatória simples,
pode-se empregar a amostragem sistemática pelas seguintes razões:
• a amostragem sistemática é mais fácil de se executar e, por isso, está
menos sujeita a erros do entrevistador do que aqueles que acontecem
na aleatória simples; a amostragem sistemática frequentemente
proporciona mais informações por custo unitário do que a aleatória
simples.
Diretrizes para calcular as amostras:
1º - Estabelecer o intervalo de amostragem K:

OBS: Para valores de K=N/n , arredondar para o valor inteiro menor.

2º - Iniciar aleatoriamente a composição da amostra.


b → inicio (nº de ordem inicial sorteado na TNA).
OBS: 0 < b ≤ K

3º - Composição da Amostra:
1º item →b
2º item →b + K
3º item →b + 2k
Exemplo:
1 – Suponhamos uma rua contendo quinhentos prédios, dos quais
desejamos obter uma amostra formada de vinte prédios. (TNA, 3ªLinha e 5ª
Coluna)
Solução:
a) Calcular K (intervalo de amostragem)
b) K=500/20, K=25
c) b= 12 (valor encontrado na TNA)
d) Composição da amostra
1º item → 12
2º item → 12 + 25 = 37
3º item → 12 + 2*25 = 62
20º item → 12 +19*25 = 487

Tabela de Números Aleatórios


Distribuição de Frequência

Vamos considerar, o estudo detalhado da distribuição de frequência, que


é a forma pela qual podemos descrever os dados estatísticos resultantes de
variáveis quantitativas. São objetivos:
• Compor uma distribuição de frequência com ou sem intervalos de classe;
• Determinar o quadro de frequências, eles são úteis para condensar
grandes conjuntos de dados, facilitando o sua utilização;
• Representar uma distribuição de frequência através de histograma,
polígono e ogiva.

Conceitos
Ao analisarmos um conjunto de dados, devemos determinar se temos
uma amostra ou uma população. Essa determinação afetará não somente os
métodos utilizados, mas também as conclusões, pois se estamos trabalhando
com uma amostra os resultados encontrados são estimativas da população.
Nem sempre é possível compreender o significado contido numa
amostragem por simples inspeção visual dos dados numéricos coletados.
Entretanto, entendemos que o sucesso de uma decisão dependerá da nossa
habilidade em compreender as informações contidas nesses dados. O objetivo
deste estudo é mostrar a organização, apresentação e análise gráfica de uma
série de dados, matéria prima das distribuições de frequências e dos
histogramas. Frequência de uma observação é o número de repetições dessa
observação, ou seja, quantas vezes determinado fenômeno acontece.
Os dados podem ser classificados como:
• Dados brutos – são os dados originais, que ainda não se encontram
prontos para análise, por não estarem numericamente organizados.
(Também são conhecidos como Tabela Primitiva).

Exemplo: Número mensal de aparelhos defeituosos na Empresa X.


• Rol – são os dados brutos, organizados em ordem crescente ou
decrescente.
Exemplo: Considerando o exemplo anterior temos:

• Dados discretos – a variável é discreta quando assume valores em


pontos da reta real.
Exemplo: número de erros em um livro: 0,1,2,3,4,.... número de filhos de
vários casais: 1,2,3,4,.....
quantidade de acidentes em determinada rodovia: 4,10,12,15,....
• Dados contínuos – a variável pode assumir, teoricamente, qualquer valor
em certo intervalo da reta real.
Exemplo: peso de alunos: 55,5 kg; 61,0kg; 63,4 kg; 68,1 kg.......
distância entre cidades: 35,5 km; 48,6 km; 100,10 km; ....

• Dados Tabelados não agrupados em classes – os valores da variável


aparecem individualmente.
Exemplo, considerando os dados da tabela anterior:
• Dados Tabelados agrupados em classes - os valores da variável não
aparecem individualmente, mas agrupados em classes.

Elementos de uma distribuição de frequência: amplitude total,


limites de classe, amplitude do intervalo de classe, ponto médio da
classe, frequência absoluta, relativa e acumulada

Amplitude total (A) - é a diferença entre o maior e o menor número


do rol.
Exemplo: Estatura de 40 alunos do Colégio A em cm. (Dados ordenados
em ordem crescente, por colunas)

150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173

A = 173 – 150 = 23

Número de classes (K) e Classe (i) – não existe regra fixa para se
determinar o número de classes. Podemos utilizar:

• A Regra de Sturges, que nos dá o número de classes em função do


número de valores da variável:
K=1+3,3.log n, onde n é o número de itens que compõe a amostra;
• Ou

Exemplo: considerando o exemplo anterior n=40


• Pela formula de Sturges: K= 1+3,3log40 = 6,28 → K=6
• Adotando K = n , temos k = 40 =6,3 → K=6

Amplitude de um intervalo de classe (h) – ou simplesmente


intervalo de classe é a medida do intervalo que define a classe.

h=A/K
Exemplo, considerando o exemplo anterior:
H = 23/ 6 = 3,83 → h = 4
Limites de Classe – denominamos limites de classe os extremos de
cada classe. Assim temos:
• limite inferior (linf) e
• limite superior (Lsup)
Observação: Vamos trabalhar com intervalos fechados à esquerda e
abertos à direita; isso significa que valores iguais ou superiores ao limite inferior
são considerados nessa classe e valores iguais e/ou superiores ao limite
superior são considerados na classe abaixo.
Exemplo: Do exemplo anterior, temos:

Na segunda classe, temos:


• L2=158
• l2 = 154

Ponto Médio da Classe - (xi) – é, como o próprio nome indica, o


ponto que divide o intervalo de classe em duas partes iguais. Para
obtermos o ponto médio de uma classe, calculamos:

Exemplo: considerando a segunda classe do exemplo anterior, temos:


x2 = =156 → x2 =156

Você também pode gostar