Trabalho de Estatistica

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 15

INSTITUTO SUPERIOR DE CIÊNCIAS E EDUCAÇÃO A DISTÂNCIA

Faculdade de ciências de educação

Curso de licenciatura em ensino de Geografia

Medidas de variabilidade e sua aplicação na análise de dados geográficos

Bendita António, código: 91230325

Cabo Delgado, Março de 2023

0
INSTITUTO SUPERIOR DE CIÊNCIAS E EDUCAÇÃO A DISTÂNCIA

Faculdade de ciências de educação

Curso de licenciatura em ensino de Geografia

Medidas de variabilidade e sua aplicação na análise de dados geográficos

Trabalho do campo a ser submetido


na cadeira de Estatística na
coordenação do curso de
Licenciatura em Ensino de
Geografia da UNISCED

Tutor:

Bendita António, código: 91230325

Cabo Delgado, Março de 2023

1
Conteúdo
1. Introdução.................................................................................................................. 3
a) Objectivo Geral...................................................................................................... 3
b) Objectivos Específicos .......................................................................................... 3
1.1. Metodologia de pesquisa. ...................................................................................... 3
2. Conceitos ................................................................................................................... 4
2.1. Medidas de Variabilidade ...................................................................................... 4
2.2. Variáveis ................................................................................................................ 4
2.2.1. Variáveis qualitativas ......................................................................................... 4
2.2.2. Variáveis quantitativas ....................................................................................... 5
3. Dados Geográficos .................................................................................................... 5
3.1. Tipos de dados geográficos ................................................................................... 6
3.2. Suas principais aplicações ..................................................................................... 6
4. Análise Estatística ..................................................................................................... 7
4.1. Análise Estatística Descritiva Clássica .................................................................. 7
4.2. Medidas de Posição ............................................................................................... 7
4.3. Medidas de Dispersão............................................................................................ 7
4.4. Medidas de Forma da Distribuição........................................................................ 7
4.5. Correlação Linear Simples .................................................................................... 8
4.6. Histograma ............................................................................................................ 9
5. Análise Geoestatística ............................................................................................... 9
5.1. Métodos de Interpolação ..................................................................................... 10
5.2. Interpolação Através da Média Móvel ................................................................ 10
5.3. Interpolação por Vizinho mais Próximo.............................................................. 10
5.4. Interpolação por Média Ponderada ...................................................................... 10
5.5. Interpolação Acumulativa.................................................................................... 11
5.6. Interpolação por Triangulação ............................................................................. 11
6. Análise Semivariográfica e Interpolação por Krigagem ......................................... 11
6.1. Interpolação por Ponderação Direccional............................................................ 12
6.2. Interpolação por Superfície de Tendência Polinomial ........................................ 12
7. Conclusão ................................................................................................................ 13
8. Referencia Bibliográfica ......................................................................................... 14

2
1. Introdução
Uma das ferramentas mais utilizadas hoje em dia em todas as áreas do conhecimento é a
Estatística, que descreve os dados observados e desenvolve metodologia para tomada de
decisão em presença de incerteza.

Actualmente, a estatística é utilizada em diferentes áreas e contextos, como testes


ligados ao desempenho escolar, pesquisas eleitorais, estudos financeiros, controle de
qualidade, análises de crescimento de doenças, taxas populacionais, índices de
desenvolvimento, índices de desemprego, modelagem de fenómenos da natureza, etc.

a) Objectivo Geral.
 Conhecer as medidas de variabilidade e sua aplicação na análise de dados
geográficos.

b) Objectivos Específicos
:
 Interpretar as medidas de variabilidade e sua aplicação na análise de dados
geográficos;
 Relacionar as medidas de variabilidade e sua aplicação na análise de dados
geográficos.
 Explicar as medidas de variabilidade e sua aplicação na análise de dados
geográficos.

1.1.Metodologia de pesquisa.
Uma pesquisa está classificada de acordo com objectivos, finalidade prática,
metodologia e tipos de perguntas. Cabe ainda, consoante Moreira e Caleffe (2006, p.
74), informar que este trabalho do campo é de cunho principalmente bibliográfico, onde
“é desenvolvida a partir de material já elaborado”. Documentos digitais, contidos em
sites, também serviram para ilustrar o trabalho, a fim de fazer a temática mais
entendível. Assim, foram determinados os objectivos do trabalho, a escolha dos
documentos e sua acessibilidade, a análise dos tais, seguida da apresentação dos
resultados. Com relação ao corpus, este foi constituído dos textos obtidos dos livros e
das informações dos sítios da internet, para a possível análise acerca das medidas da
variabilidade.

3
2. Conceitos

2.1.Medidas de Variabilidade
Crespo (2002), medidas de dispersão ou de variabilidade São medidas utilizadas para
medir o grau de variabilidade ou dispersão dos valores observados em torno da média
aritmética. Servem para medir a representatividade da média e proporcionar o
conhecimento do nível de homogeneidade ou heterogeneidade dentro de cada grupo
analisado. De acordo com Dalmolin (2008), o espaço geográfico é o meio físico onde as
entidades geográficas coexistem.
Uma entidade geográfica é qualquer entidade identificável do mundo real, possuindo
características espaciais e relacionamentos espaciais com outras entidades geográficas.
Dados geográficos ou georreferenciados são dados espaciais em que a dimensão
espacial está associada à sua localização na superfície da terra, num determinado
instante ou período de tempo.

2.2.Variáveis
De acordo com Medri (2011), ao se fazer um estudo estatístico de um determinado fato
ou grupo, tem-se que considerar o tipo de variável.
Segundo Medronho (2003), elemento significa cada uma das unidades observadas no
estudo.
Após a determinação dos elementos pergunta-se: o que fazer com estes? Pode-se medi-
los, observá-los, contá-los surgindo um conjunto de respostas que receberá a
denominação de variável
Variável é a característica que vai ser observada, medida ou contada nos elementos da
população ou da amostra e que pode variar, ou seja, assumir um valor diferente de
elemento para elemento. (Acorsi; Guedes; 2011, p.2)

2.2.1. Variáveis qualitativas


Variáveis qualitativas são aquelas em que a variável assume “valores” em categorias,
classes ou rótulos. São, portanto, por natureza, dados não numéricos.
Apesar de ser considerada de baixo nível de mensuração, do ponto de vista da aplicação
de instrumental estatístico, a variável qualitativa oferece um vasto espectro de aplicação
nas ciências sociais e do comportamento. Variáveis qualitativas denotam características

4
individuais das unidades sob análise, tais como sexo, estado civil, naturalidade, raça,
grau de instrução, dentre outras, permitindo estratificar as unidades para serem
analisadas de acordo com outras variáveis.

2.2.2. Variáveis quantitativas


Variáveis quantitativas são aquelas expressas pelas variáveis com níveis de mensuração
intervalar ou de razão. Ou seja, são aqueles nas quais as variáveis assumem valores
numa escala métrica definida por uma origem e uma unidade, por exemplo: idade,
salário, peso, etc.
As variáveis qualitativas podem ser, também, classificadas como nominal e ordinal. Por
outro lado, as variáveis quantitativas podem ser classificadas como discretas, quando
assumem um número finito de valores, ou contínuas, quando assume um número
infinito de valores, geralmente em intervalos, como apresentam na Tabela 1.
Tabela1. Classificação das variáveis qualitativas e quantitativas

Variáveis Tipos Descrição Exemplos


Qualitativas Nominal Não existe Cor dos olhos, sexo, estado civil,
ou nenhuma tipo sanguíneo
categóricas ordenação
Ordinal Existe uma Nível de escolaridade, estágio da
ordenação I, II, III doença, colocação de concurso
Quantitativas Discretas Valor pertence a Número de filhos por casal,
um conjunto quantidade de leitos
enumerável
Continuas Quando o valor Medidas de altura e peso, taxa de
pertence a um glicose, nível de colesterol
intervalo real

3. Dados Geográficos
De forma simples, um dado geográfico se difere dos outros tipos de dados por
apresentar uma componente espacial, ou seja, eles representam objectos e fenómenos
que estão localizados no espaço.

5
Esse dado é formado através de um sistema de coordenadas e expressões alfanuméricas,
com o objectivo de informar se o objecto ou fenómeno avaliado está sofrendo algum
processo interno ou externo.

Portanto, o dado geográfico confere especificidade e sobreposição à informação que


deseja ser tratada. Sendo comum em estudos de topologia, cartografia,
geoprocessamento, entre outros.

3.1.Tipos de dados geográficos


Com o conceito de um dado geográfico claro, podemos partir para as categorias desses
elementos, que são divididos em vectoriais e raster de acordo com sua estrutura gráfica.

 A estrutura de armazenamento gráfico do tipo vectorial consiste em armazenar


os dados na forma de um conjunto de coordenadas, em outras palavras, permite
a representação dessas informações em pontos, linhas e polígonos.

3.2.Suas principais aplicações


Os dados geográficos possuem uma gama de aplicações e não se restringe a área Geo e
aos sistemas de informações geográficos, uma vez que ele pode ser usado de suporte
para todo e qualquer segmento que precise delimitar um espaço, como a área da saúde,
engenharia, história, entre outros.

De modo geral, os dados geográficos são usados nos seguintes momentos:

 Pesquisas nas áreas da saúde, epidemias e vacinação.


 Diagnósticos ambientais
 Google maps e aplicativos de GPs
 Estudos de topografia e cartografia
 Pesquisas de planejamento urbano e engenharia civil
 Geoprocessamento
 Arqueologia

6
4. Análise Estatística
A análise estatística dos dados foi processada em duas etapas. A primeira fase consistiu
na análise estatística descritiva clássica ou análise exploratória dos dados. Na segunda
fase, foram utilizados métodos geoestatísticos como as interpolações por inverso da
distância e análises semivariográficas para estudar a variabilidade espacial dos dados
colectados em campo (Dante, 2003).
4.1. Análise Estatística Descritiva Clássica
A análise estatística descritiva clássica visou caracterizar as posições centrais de
dispersão dos dados, além de expressar a forma da distribuição.
Para isso foram calculadas medidas de posição, medidas de dispersão e medidas de
forma de distribuição. Os itens abaixo descrevem essas medidas.

4.2.Medidas de Posição
Dentre as medidas de posição calculadas pode-se citar.
a) Média Aritmética ( ̅ ): consiste na média simples dos dados

=

b) Erro Padrão da Média: esse valor apresenta a precisão da estimativa da média e


pode ser obtido pela fórmula:

=

4.3.Medidas de Dispersão
Dentre as medidas de dispersão calculadas pode-se citar.
a) Amplitude: amplitude dos dados é a diferença entre o maior e o menor valor
presentes nos dados amostrados.
b) Variância (S²): é a medida obtida por meio da fórmula abaixo.
∑ ( − )
=
−1

4.4.Medidas de Forma da Distribuição


a) Coeficiente de Variação (CV): é a medida da razão entre o desvio padrão e a
média aritmética. O resultado apresenta quão maior ou menor é o desvio padrão
da média. Este coeficiente dá uma ideia da regularidade ou homogeneidade das
amostras que estão sendo estudadas.

7
b) Coeficiente de Assimetria (A3): assimetria é o grau de desvio de uma curva no
sentido horizontal, podendo esse desvio ser positivo ou negativo. O coeficiente
de assimetria pode ser calculado por:
∑ ( = )
=
×
Para distribuições assimétricas, a média tende a se situar do mesmo lado da moda, onde
a cauda da curva de distribuição é mais longa; por isso, outra medida de assimetria pode
ser obtida pela seguinte fórmula:
( − ) 3( − )
= =

Os dados são considerados simétricos para |A3|<0,15, assimétrica moderada para


0,15_|A3|<1 e assimétrica forte para |A3|_1.c. Coeficiente de Curtose: curtose é o grau
de achatamento de uma curva em relação a uma curva representativa de uma
distribuição normal. O coeficiente de curtose pode ser calculado pela fórmula:
∑ ( − )
=
×
Uma curva apresenta bom ajuste ao modelo normal se obtiver assimetria entre

±3 e (curtose -3) entre os valores ±6 .

A classificação segundo o coeficiente de curtose segue os seguintes intervalos:


 Se o valor do coeficiente de curtose for igual a 3, tem-se o mesmo achatamento
que o da distribuição normal. Assim sendo estas funções são denominadas de
mesocúrticas.
 Se o valor do coeficiente de curtose for maior que 3, a distribuição apresenta
uma curva mais alta (afunilada) e concentrada se comparado a ditribuição
normal. O nome dado a esse tipo de função é leptocúrtica.
 Se o valor do coeficiente de curtose for menor que 3 a função distribuição é mais
“achatada” se comparada a distribuição normal, neste caso a função é
denominada platicúrtica.

4.5.Correlação Linear Simples


O coeficiente de correlação é representado por r. Os valores de r variam de -1
(correlação inversa) e +1 (correlação directa), sendo o valor zero a representação de

8
ausência de correlação linear. Cabe ressaltar que não ter correlação linear não implica
que as variáveis não tenham outro tipo de correlação. O valor de r pode ser obtido por:
∑ [( − )( − )]
=
( − 1) ×
Onde Sx e Sy representam respectivamente os desvios padrões das variáveis X e Y da
amostra analisada.

4.6.Histograma
Dante (2003), a maneira mais usual de representação gráfica de dados amostras é o
histograma. O histograma consiste em um grupo de rectângulos que tem por base o eixo
das abcissas e por ponto médio o valor central do intervalo de classe.
Caso esses intervalos sejam iguais as alturas desses rectângulos serão proporcionais às
frequências de classe, com isso tomam-se as alturas como iguais as frequências.
A construção de histogramas é uma das representações preliminares de dados
estatísticos. Através desta representação pode-se observar a distribuição dos dados e
verificar se a distribuição se aproxima de alguma função já conhecida como a normal.
De acordo com Dayrell (2000) citado por Dalmolin (2008), os histogramas assim como
os mapas de distribuição são uma poderosa ferramenta para a descrição espacial dos
dados através da sua visualização.

5. Análise Geoestatística
A geoestatística é uma divisão da estatística que alia o conceito de variáveis aleatórias
com o conceito de variáveis regionalizadas, gerando assim um conceito de funções
aleatórias. Seu uso começou a ser difundido nas décadas de 60 e 70 pelas empresas
mineradoras, e no final dos anos 80 pela indústria de petróleo.
Como os métodos geoestatísticos fornecem uma base estatística que aliam os dados às
coordenadas espaciais das observações, para o presente estudo, a utilização destes
métodos foi essencial para a interpretação dos dados colectados em campo. A análise
dos dados foi elaborada através da confecção de modelos espaciais dos dados
amostrados.

9
5.1.Métodos de Interpolação
Para a confecção dos modelos digitais de grade regular foi necessário definir as funções
interpolantes locais. Essas definições são dadas para cada elemento da malha, assim
cada elemento básico da grade rectangular define uma função interpolante que é válida
para os pontos internos ao elemento, esse processo é denominado ajuste de superfície.
As funções de ajuste em geral são polinómios que são definidos utilizando-se os
vértices dos elementos, e muitas vezes os vértices dos elementos vizinhos também.
A representação das variações dos fenómenos foi expressa através dos interpoladores de
tendência, a partir de regressões polinomiais. O ajuste das superfícies polinomial
referentes a todos os dados amostrais e minimizam os erros de ajuste global. Em geral
utiliza-se uma minimização do erro médio quadrático.

5.2.Interpolação Através da Média Móvel


Um dos métodos mais simples para a estimativa dos valores de cota dos pontos de uma
grade regular é denominado de interpolação através da média móvel ou interpolação
através da média das cotas das amostras vizinhas. A regra matemática que gera essa
interpolação é:

=

Em que:
zi: é o valor da cota de um ponto i qualquer da grade;
zj: é a cota de uma amostra j vizinha do ponto i da grade;
wij: é um factor de ponderação.

5.3.Interpolação por Vizinho mais Próximo


A interpolação por vizinho mais próximo é definido pela escolha de apenas uma
amostra vizinha para cada ponto da grade, isto é, quando j igual a 1. Neste método para
cada nó da rede é atribuído o valor do ponto mais próximo.

5.4.Interpolação por Média Ponderada


A interpolação por média ponderada é um método onde o valor de cota de cada
elemento da grade é definido pela média ponderada dos valores de cota das amostras
vizinhas. A ponderação mais usada na prática é o inverso da distância euclidiana do

10
ponto da grade à amostra considerada, isto é, calcula-se o valor de um ponto através da
média dos pontos mais próximos. A média é ponderada pelo inverso da distância entre
os pontos, a formulação para esse método pode ser observada na Equação 4.9:

= Equação 4.9

Em que:
Z: é o valor interpolado para o nó da grade;
Zi: é o valor do ponto amostrado vizinho ao nó;
hij: distância entre o nó da grade e
Zi: expoente de ponderação (peso);
n: número de pontos amostrados utilizados para interpolar cada nó.
O inverso da distância é utilizado para atenuar a influência de pontos distantes, e é
fundamentado no pressuposto de existência de correlação espacial positiva.

5.5.Interpolação Acumulativa
A interpolação acumulativa é o método quando os nós são representados pela soma dos
valores dos pontos de uma dada região. Este método é válido quando há presença de
dados ponderados.

5.6.Interpolação por Triangulação


A triangulação é um método que conecta os pontos amostrados através de triângulos. Os
dados dos pontos são os vértices dos triângulos formados por linhas imaginárias. Tenta-
se formar ângulos o mais equiangulares possíveis.
Para cada nó da rede que se encontra dentro de cada triângulo é atribuído um valor com
base na intercepção com o plano inclinado triangular. Para os nós de rede que ficam
dispostos fora da rede de triângulos podem ser atribuído valores usando o inverso da
distância.

6. Análise Semivariográfica e Interpolação por Krigagem


O semivariograma é uma função intrínseca que mostra a estrutura do
fenômeno estudado. As relações estatísticas são medidas pelas co-variâncias que
existem entre as amostras espaçadas de valores h.
11
O semivariograma é definido como a variância do erro que se comete ao estimar um
teor desconhecido em (x+h) pela ajuda de um ponto dado em (x). O semivariograma em
uma determinada direcção indica quão irregular os valores se tornam quando a distância
de medida aumenta.
A expressão do semivariograma é definida por:
( )
(ℎ) = ∑ [ ( )− ( + ℎ)] Equação 4.10
( )

Sendo N(h) o número de pares de valores separados entre si por uma magnitude h na
direcção deste vector. Usualmente plota-se os valores de (h) no eixo das ordenadas e os
valores de h no eixo das abcissas, fazendo as duas origens se coincidirem no zero.

6.1.Interpolação por Ponderação Direccional


A ponderação direccional é um método de interpolação que utiliza o inverso da
distância aliado a uma ponderação direccional. Pode-se especificar essa direcção como
unidireccional, bidireccional ou diversas direcções pré definidas.

6.2.Interpolação por Superfície de Tendência Polinomial


A interpolação por superfície de tendência polinomial é um método que busca encontrar
as tendências regionais dos dados. A tendência é ajustada através de polinómios de
ordens diversas. Esses polinómios são gerados por critérios de regressão por mínimos
quadrados. Após o ajuste da tendência é determinado um factor de correlação, sendo
que quanto maior o valor deste factor melhor será o ajuste estipulado.

12
7. Conclusão
O primeiro passo para realizar uma análise de dados envolve a inspecção das
variáveis individualmente. Essa exploração dos dados pode ser realizada por meio de
tabelas de contingência para variáveis categóricas, ou por meio de medidas numéricas
para variáveis numéricas, além de recursos gráficos para ambos os tipos de variáveis
Em algumas situações podem-se atribuir valores numéricos às várias qualidades ou
atributos e depois proceder à análise como esta variável como se fosse quantitativa,
desde que o procedimento seja passível de interpretação.
Uma vez obtidos os dados referentes às variáveis qualitativas, a tarefa seguinte é
representá-los através de uma tabela e de um gráfico. Posteriormente, poderá ser útil
calcular as frequências, simples, acumuladas e as relativas.

13
8. Referencia Bibliográfica
CRESPO, A. A. Estatística Fácil. São Paulo: Editora Saraiva, 2002.
CIRIBELLI, Marilda Corrêa. Como elaborar uma dissertação de Mestrado através da
pesquisa científica.
DALMOLIN, Beatriz Helena, et al. MAPA Referencial para Construção de Material
Didáctico – Programa e-Tec Brasil. 2. ed. Revisada. Florianópolis: Universidade
Federal de Santa Catarina – UFSC, 2008.
DANTE, L. R. Matemática: contexto e aplicações. 3 v. São Paulo: Ática, 2003

LIBÂNEO, J.C. (1990) Organização e Gestão Escolar: teoria e prática. Editora


Alternativa: Goiânia.
Marilda Ciribelli Corrêa, Rio de Janeiro: 7 Letras, 2003.
Guedes, Terezinha Aparecida, Aprender Fazendo Estatística Projecto de Ensino, UEM
2011.
MEDRI, waldir análise exploratória de dados, Dissertação, 2005

SALVADOR, Wesyllis das Mercês análise do conteúdo de estatística descritiva no


ensino médio, trabalho de conclusão, Campina Grande – PB Agosto/2015

14

Você também pode gostar