1 - Introdução A Estatística
1 - Introdução A Estatística
1 - Introdução A Estatística
Importância da Estatística
Amostragem
É o processo de escolha da amostra. É a parte inicial de qualquer estudo
estatístico. Consiste na escolha criteriosa dos elementos a serem submetidos
ao estudo. Geralmente, as pesquisas são realizadas através de estudo dos
elementos que compõem uma amostra, extraída da população que se pretende
analisar.
População e amostra
Estatística Descritiva
Probabilidade
Planejamento
Séries Estatísticas
Define-se série estatística como toda e qualquer coleção de dados
estatísticos referidos a uma mesma ordem de classificação: quantitativa. No
sentido mais amplo, série é uma sucessão de números referidos a qualquer
variável. Se os números expressarem dados estatísticos, a série será chamada
de série estatística.
Em sentido mais restrito, pode-se dizer que uma série estatística é uma
sucessão de dados estatísticos referidos a caracteres qualitativos, ao passo
que uma sucessão de dados estatísticos referidos a caracteres quantitativos
configurará uma Distribuição de Frequência.
Em outros termos, a palavra série é usada normalmente para designar
um conjunto de dados dispostos de acordo com um caráter variável, residindo
a qualidade serial na disposição desses valores, e não em uma disposição
temporal ou espacial de indivíduos.
Tabela é um quadro que resume um conjunto de observações.
Uma tabela compõe-se de:
• Corpo – conjunto de linhas e colunas que contém informações sobre a
variável em estudo;
• Cabeçalho – parte superior da tabela que especifica o conteúdo das
colunas;
• Coluna indicadora – parte da tabela que especifica o conteúdo das
linhas;
• Linhas – retas imaginárias que facilitam a leitura, no sentido horizontal,
de dados que se inscrevem nos seus cruzamentos com as colunas;
• Casa ou célula – espaço destinado a um só número;
• Título – conjunto de informações, as mais completas possíveis,
respondendo às perguntas: O quê? - Quando? - Onde? - localizado no
topo da tabela.
• Fonte – referência de onde se obteve os dados, colocado, de
preferência, no rodapé.
• As tabelas servem para apresentar séries estatísticas. Conforme varie
um dos elementos da série, podemos classificá-la em:
• Cronológicas - Tempo (fator temporal ou cronológico) – a que época se
refere o fenômeno analisado;
• Geográficas - Local (fator espacial ou geográfico) – onde o fenômeno
acontece;
• Específicas - Fenômeno (espécie do fato ou fator especificativo) – o que
é descrito.
As séries também são divididas em:
• Séries Homógradas - aquelas em que a variável descrita apresenta variação
discreta ou descontínua. São séries homógradas a série temporal, a série
geográfica e a série específica;
• Séries Heterógradas - aquelas nas quais o fenômeno ou o fato apresenta
graduações ou subdivisões. Embora fixo, o fenômeno varia em intensidade.
A Distribuição de frequências ou seriação é uma série heterógrada.
Os dados estatísticos resultantes da coleta direta da fonte, sem outra
manipulação senão a contagem ou medida, são chamados dados absolutos.
Dados Relativos são o resultado de comparações por quociente (razões) que
se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar
as comparações entre quantidades.
Série Cronológica
Janeiro 2300
Fevereiro 1800
Março 2200
Abril 2210
Maio 2360
Junho 2600
Julho 2690
Agosto 3050
Setembro 3500
Outubro 3440
Novembro 3100
Dezembro 2760
TOTAL ANUAL 31510
Série Geográfica
Paraná 2230
Outros 420
TOTAL BRASIL 31510
Série Específica
Também chamada de série categórica ou série por categoria, identifica-
se pelo caráter variável de fator especificativo. Assim, deve-se ter:
Elemento variável: Fenômeno
Elementos Fixos: Local e Época
Exemplos:
Tabela 1.3.– Operadora WKX -
Venda de bilhetes aéreos por Linha – 1995
Linha A 6450
Linha B 9310
Linha C 15750
Até 80 41 326
Fonte: IPEA
Tabela 1.6 – População Indígena Brasileira
Unidade de Produção
Produção 1937 1938 1939
Observação:
Nem sempre uma tabela representa uma série estatística. Por vezes, os
dados reunidos não revelam uniformidade, sendo meramente um aglomerado
de informações gerais sobre determinado assunto, as quais, embora úteis, não
apresentam a consistência necessária para se configurar uma série estatística.
Exemplo: Tabela com resumos de dados, mas que não representa uma
série estatística.
Tabela 1.8 – Situação dos espetáculos cinematográficos no Brasil –
1967
500
400
300
200
100
0
1971 1972 1973 1974 1975 1976 1977
anos
Gráfico em Colunas
É a representação de uma série por meio de retângulos, dispostos
verticalmente. Exemplo: População Brasileira nas décadas de 40 a 70.
População
100
80
60
População
40
20
0
1940 1950 1960 1970
População do Brasil
1970
1960
População do
1950 Brasil
1940
0 20 40 60 80 100
Gráfico em Setores
1975 90
1976 120
1977
Total
Total __________360º
Parte___________ xº
Para 1975: 360 - 360º Para 1976: 360 - 360º Para 1977: 360 - 360º
90 - xº 120 - xº 150 - xº
x = 90º x = 120º x = 150º
Receita do Municipio X
1975
1976
1977
Gráfico Polar
É o gráfico ideal para representar séries temporais cíclicas, isto é, séries
que apresentam em seu desenvolvimento determinada periodicidade, como,
por exemplo, a variação da precipitação pluviométrica ao longo do ano, ou da
temperatura ao longo do dia, o consumo de energia elétrica durante o mês ou o
ano, etc.
Exemplo:
Movimento Mensal de Compras de uma agencia em 1972
Meses Valores (R$1.000,00)
Janeiro 12
Fevereiro 13
Março 14
Abril 12
Maio 15
Junho 19
Julho 17
Agosto 18
Setembro 14
Outubro 16
Novembro 12
Dezembro 18
Jan
20
Dez Fev
15
Nov 10 Mar
5
Out 0 Abr
Set Mai
Ago Jun
Jul
Amostragem
Conceitos Fundamentais
Exemplo:
Supondo, no exemplo anterior, que, dos noventa alunos, 54 sejam
meninos e 36 sejam meninas, vamos obter uma amostra proporcional
estratificada de 10%.
Resolução:
• São, portanto, dois estratos (sexo masculino e feminino) e
queremos uma amostra de 10% da população;
• Calcula-se o número de amostras de cada estrato.
F 36 3,6 4
Total 90 9,0 9
Amostragem Sistemática
Quando os elementos da população já se encontram ordenados, não há
necessidade de se construir o sistema de referência. Nesses casos, a seleção
dos elementos que constituirão a amostra pode ser por um sistema imposto
pelo pesquisador.
Em geral, para se obter uma amostra sistemática de n elementos de
uma população de tamanho N, K deve ser menor ou igual a N/n. Não é
possível determinar K, precisamente, quando o tamanho da população é
desconhecido, mas pode-se supor um valor de k de tal modo que seja possível
obter uma amostra de tamanho n. Em vez da amostragem aleatória simples,
pode-se empregar a amostragem sistemática pelas seguintes razões:
• a amostragem sistemática é mais fácil de se executar e, por isso, está
menos sujeita a erros do entrevistador do que aqueles que acontecem
na aleatória simples; a amostragem sistemática frequentemente
proporciona mais informações por custo unitário do que a aleatória
simples.
Diretrizes para calcular as amostras:
1º - Estabelecer o intervalo de amostragem K:
3º - Composição da Amostra:
1º item →b
2º item →b + K
3º item →b + 2k
Exemplo:
1 – Suponhamos uma rua contendo quinhentos prédios, dos quais
desejamos obter uma amostra formada de vinte prédios. (TNA, 3ªLinha e 5ª
Coluna)
Solução:
a) Calcular K (intervalo de amostragem)
b) K=500/20, K=25
c) b= 12 (valor encontrado na TNA)
d) Composição da amostra
1º item → 12
2º item → 12 + 25 = 37
3º item → 12 + 2*25 = 62
20º item → 12 +19*25 = 487
Conceitos
Ao analisarmos um conjunto de dados, devemos determinar se temos
uma amostra ou uma população. Essa determinação afetará não somente os
métodos utilizados, mas também as conclusões, pois se estamos trabalhando
com uma amostra os resultados encontrados são estimativas da população.
Nem sempre é possível compreender o significado contido numa
amostragem por simples inspeção visual dos dados numéricos coletados.
Entretanto, entendemos que o sucesso de uma decisão dependerá da nossa
habilidade em compreender as informações contidas nesses dados. O objetivo
deste estudo é mostrar a organização, apresentação e análise gráfica de uma
série de dados, matéria prima das distribuições de frequências e dos
histogramas. Frequência de uma observação é o número de repetições dessa
observação, ou seja, quantas vezes determinado fenômeno acontece.
Os dados podem ser classificados como:
• Dados brutos – são os dados originais, que ainda não se encontram
prontos para análise, por não estarem numericamente organizados.
(Também são conhecidos como Tabela Primitiva).
150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173
A = 173 – 150 = 23
Número de classes (K) e Classe (i) – não existe regra fixa para se
determinar o número de classes. Podemos utilizar:
h=A/K
Exemplo, considerando o exemplo anterior:
H = 23/ 6 = 3,83 → h = 4
Limites de Classe – denominamos limites de classe os extremos de
cada classe. Assim temos:
• limite inferior (linf) e
• limite superior (Lsup)
Observação: Vamos trabalhar com intervalos fechados à esquerda e
abertos à direita; isso significa que valores iguais ou superiores ao limite inferior
são considerados nessa classe e valores iguais e/ou superiores ao limite
superior são considerados na classe abaixo.
Exemplo: Do exemplo anterior, temos: