Resenha - TD X Estatística Espacial

Investindo no Brasil: Análise espacial dos investidores do Tesouro Direto e
seu contexto socioeconômico.
Autores:
Euires Felippe Rossi
Lucas Alves Penna
Luis Felipe Ulian
Nathan Dias
Thiago Aguiar
Victor Marques Almeida
Fundação Getulio Vargas

São Paulo
RESUMO
Este estudo propõe uma análise abrangente da correlação entre indicadores sociais e
econômicos específicos, como população, educação, renda e Índice de Desenvolvimento
Humano (IDH), e a participação de investidores no programa do Tesouro Direto nos
municípios brasileiros. A escolha desses indicadores busca compreender como fatores
socioeconômicos podem influenciar o envolvimento da comunidade no mercado de
investimentos.
A utilização de dados fornecidos pelo Instituto Brasileiro de Geografia e Estatística
(IBGE) oferece uma base sólida para a análise, permitindo uma avaliação mais precisa das
características demográficas, educacionais e econômicas de cada município. A abordagem
geoespacial adiciona um componente espacial à pesquisa, possibilitando uma compreensão
mais profunda das disparidades regionais e padrões geográficos na participação de
investidores no Tesouro Direto.
Ao explorar a relação entre esses indicadores e a adesão ao programa, espera-se
identificar padrões e tendências que possam contribuir para uma compreensão maior da
dinâmica socioeconômica relacionada aos investimentos no Tesouro Direto.
INTRODUÇÃO
O Tesouro Direto é uma iniciativa que surgiu da parceria entre o Tesouro Nacional e a
B3 (Brasil, Bolsa, Balcão), a principal bolsa de valores do Brasil. Lançado em 2002, esse
programa permitiu o acesso dos brasileiros aos títulos públicos federais de uma forma fácil e
prática, tendo em vista que anteriormente o acesso a tais investimentos eram possíveis
somente através de fundos de investimento.
A B3 atua como plataforma de negociação e registro das operações do Tesouro
Direto. Sua infraestrutura permite que investidores de todos os perfis, sejam iniciantes ou
experientes, tenham acesso facilitado à compra e venda de títulos públicos.
Uma característica do Tesouro Direto é a acessibilidade. Com um investimento inicial
mínimo de apenas R$30,00 ou 1% do preço unitário do título. Comparado à tradicional
poupança, o Tesouro Direto apresenta vantagens significativas. Além de oferecer uma
variedade de títulos com diferentes prazos e rentabilidades, os títulos públicos são
considerados investimentos de baixo risco, uma vez que são emitidos pelo governo federal. A
diversidade de opções permite aos investidores escolherem aquele que melhor se alinha aos
seus objetivos financeiros, seja investimentos pré fixados, pós fixados indexados ao CDI ou
atrelados ao IPCA.
Segundo dados divulgados pela B3 no relatório divulgado trimestralmente “Perfil
pessoa física”, atualmente existem 2,2 milhões de investidores com uma posição total de
R$116,5 bi. No gráfico abaixo podemos verificar o crescimento exponencial do programa ao
longos dos anos:
Figura 1: Evolução dos investimentos de pessoa física
Em uma década aproximadamente, o programa do Tesouro Direto registrou uma

evolução expressiva, com um aumento de 2.100 vezes no número de investidores.
Inicialmente contando com 100.000 participantes, esse número disparou para 2,2 milhões.
Simultaneamente, a custódia total apresentou um crescimento expressivo também,
elevando-se de R$10,3 bilhões para R$116,5 bilhões, marcando um aumento substancial de
1.031 vezes ao longo desse período.
É possível observar que, à medida que o programa do Tesouro Direto expandiu-se e
ganhou maior popularidade, o saldo mediano dos investidores experimentou uma redução ao
longo dos anos. No ano de 2013, o saldo mediano era de R$23.000, contrastando
significativamente com os R$3.100 registrados em 2023. Esse fenômeno sugere uma maior
diversificação e participação de investidores com montantes menores, refletindo a
democratização do acesso ao mercado financeiro e a inclusão de uma base mais ampla de
investidores no programa.
METODOLOGIA
A definição metodológica em um trabalho que analisa a correlação espacial entre
variáveis sociais e econômicas e investimentos no Tesouro Direto é de suma importância,
pois estabelece o rigor e a validade científica do estudo. Uma metodologia bem estruturada
assegura que a coleta e a análise dos dados sejam realizadas de maneira sistemática e
replicável, permitindo que os resultados sejam confiáveis e defensáveis. Além disso, uma
metodologia clara e detalhada permite a outros pesquisadores entenderem e, se necessário,
replicar o estudo, o que é essencial para o avanço do conhecimento na área. No contexto
deste trabalho específico, uma metodologia robusta é crucial para garantir que as conclusões
sobre as relações entre as variáveis sociais, econômicas e os investimentos sejam precisas e
fundamentadas, proporcionando insights valiosos para políticas econômicas e estratégias de
investimento.
O primeiro passo desta metodologia envolve a coleta de dados rigorosa e criteriosa.
Esta fase é crucial para garantir a qualidade e a relevância das informações analisadas. Dados
sobre variáveis sociais e econômicas serão coletados de fontes confiáveis, como institutos de
pesquisa governamentais e bancos de dados acadêmicos. Em paralelo, informações sobre os
investimentos no programa do Tesouro Direto serão obtidas diretamente de fontes oficiais,
como o site da B3. A seleção de dados abrangerá um período significativo para permitir uma
análise temporal robusta, e as informações serão verificadas para precisão e completude antes
de serem utilizadas nas etapas subsequentes.
Após a coleta de dados, a próxima etapa é a análise detalhada das variáveis. Este
processo envolve a investigação de padrões, tendências e possíveis correlações entre as
variáveis sociais e econômicas e os investimentos no Tesouro Direto. Ferramentas analíticas e
técnicas de visualização de dados serão empregadas para identificar características
importantes, como distribuição, variação e potenciais outliers. Esta análise preliminar é vital
para compreender a natureza dos dados e para informar as decisões na modelagem estatística
subsequente.
A terceira fase é o estudo de modelagens estatísticas. Com base nas informações
obtidas na fase de análise das variáveis, diferentes modelos estatísticos serão explorados para
entender a relação entre as variáveis sociais e econômicas e os investimentos no Tesouro
Direto. Modelos de autocorrelação espacial, como o Índice de Moran, serão considerados
para analisar a dependência espacial entre as variáveis. Além disso, serão avaliados modelos
de regressão e outras técnicas estatísticas avançadas para capturar a complexidade e a
dinâmica das relações entre as variáveis.
Por fim, a escolha do melhor modelo estatístico é uma etapa decisiva. Esta seleção
será baseada em critérios como a adequação do modelo aos dados, a precisão das previsões, a
interpretabilidade e a capacidade de generalização. Ferramentas de validação cruzada e
métricas de desempenho, como o coeficiente de determinação (R²) e o erro médio quadrático,
serão utilizadas para avaliar a eficácia de cada modelo. O modelo escolhido será aquele que
melhor captura a relação entre as variáveis sociais e econômicas e os investimentos no
Tesouro Direto, fornecendo insights valiosos e direcionando futuras decisões de política e
investimento.
COLETA DE DADOS
Os dados divulgados pelo Instituto Brasileiro de Geografia e Estatística (IBGE)
constituem um pilar essencial para a compreensão do panorama socioeconômico do Brasil.
Entre esses indicadores, o Índice de Desenvolvimento Humano (IDH) destaca-se como uma
medida abrangente que avalia não apenas o crescimento econômico, mas também fatores
como saúde e educação. O IDH é uma ferramenta valiosa para mensurar o bem-estar geral da
população, proporcionando insights sobre o desenvolvimento humano ao longo do tempo e
entre diferentes regiões do país.
O Produto Interno Bruto per capita (PIB per capita) é outro indicador crucial,
calculado dividindo o PIB total de uma região ou país pela sua população. Esse dado fornece
uma perspectiva sobre a média de renda por habitante, permitindo análises comparativas
entre áreas geográficas e ao longo do tempo. O PIB, por sua vez, representa o valor total de
bens e serviços produzidos por uma economia, oferecendo uma medida ampla do
desempenho econômico de uma nação.
A renda média, por fim, é um indicador fundamental que retrata a média aritmética
dos rendimentos de uma população. Esse dado é crucial para entender a distribuição de
recursos e a qualidade de vida, contribuindo para a análise de disparidades econômicas e
identificação de padrões de desenvolvimento.
Em conjunto, esses indicadores do IBGE desempenham um papel crucial na avaliação
do progresso e desafios enfrentados pelo Brasil em diversas esferas. Ao examinar o IDH, PIB
per capita, PIB e renda média, é possível obter uma visão abrangente da dinâmica
socioeconômica do país, permitindo que pesquisadores, formuladores de políticas e analistas
compreendam melhor as necessidades e oportunidades existentes em diferentes regiões e
estratos da sociedade brasileira. Essas informações fundamentais são a base para a
formulação de estratégias eficazes de desenvolvimento e inclusão social.
O Tesouro Direto, por meio de sua plataforma online, oferece uma transparência
valiosa ao disponibilizar dados detalhados sobre os investidores e as operações de compra e
venda de títulos públicos. Essa iniciativa visa promover uma maior compreensão e
participação dos investidores no mercado, contribuindo para a democratização do acesso às
informações financeiras. A divulgação desses dados é uma prática que reforça a transparência
e a confiança no programa, proporcionando uma visão aberta das atividades e
comportamentos dos investidores.
A plataforma do Tesouro Direto disponibiliza informações como o número total de
investidores, os valores investidos, os títulos adquiridos e as datas das operações. Além disso,
é possível acessar estatísticas detalhadas sobre a distribuição geográfica dos investidores,
permitindo uma análise mais abrangente das tendências regionais no interesse pelo programa.
Ao fornecer dados atualizados e acessíveis, o Tesouro Direto não apenas atende à
demanda por transparência, mas também capacita os investidores a tomarem decisões mais
informadas. A possibilidade de acompanhar de perto as operações de compra e venda de
títulos não apenas fortalece a confiança no mercado financeiro, mas também auxilia os
investidores na compreensão dos padrões de comportamento do mercado e na formulação de
estratégias de investimento mais assertivas.
Essa abordagem transparente e acessível por parte do Tesouro Direto destaca-se como
um exemplo positivo de como a tecnologia e a divulgação de informações podem colaborar
para a construção de um ambiente financeiro mais inclusivo e educativo, promovendo a
participação consciente dos investidores e contribuindo para o desenvolvimento sustentável
do mercado de capitais brasileiro.
Tabela 1: Variáveis escolhidas
A análise realizada na base de dados do Tesouro Direto revela insights valiosos sobre
a distribuição geográfica dos investidores e destaca a importância da integridade e qualidade
dos dados. Ao cruzar informações de transações de compra e venda com a base de
investidores, conseguimos refinar os dados para 1,7 milhão de clientes distribuídos em 5.525
municípios, abrangendo uma expressiva parcela de 99,2% do total de municípios no Brasil.
O processo de tratamento de dados duplicados e incorretos demonstra o
comprometimento com a precisão e confiabilidade das informações. A perda de 0,8% dos
municípios é uma medida relativamente pequena, considerando a complexidade e diversidade
do panorama municipal brasileiro. Os 45 municípios que ficaram de fora, embora
representem uma parcela minoritária, podem servir como ponto de atenção para possíveis
melhorias no processo de coleta ou integração de dados.
A imagem abaixo representa que por ser um campo de preenchimento com
responsabilidade do investidor, o nome do município pode ser divergente do real.
Figura 2: Exemplo de valores preenchidos no campo cidade investidor da base do tesouro direto.
Essa iniciativa de cruzamento de dados não apenas contribui para a correção de
informações imprecisas, mas também destaca a capacidade de análise e interpretação dos
dados disponíveis. A representatividade de 99,2% dos municípios oferece uma visão
abrangente e confiável da presença dos investidores do Tesouro Direto em todo o país.
Essa abordagem analítica fornece uma base sólida para futuras tomadas de decisão,
permitindo uma compreensão mais precisa dos padrões de investimento e comportamento dos
investidores em diferentes regiões. A transparência e a confiabilidade desses dados são
cruciais para a construção de estratégias eficazes e o desenvolvimento contínuo do mercado
financeiro, promovendo uma participação mais informada e consciente por parte dos
investidores.
Figura 3: Municípios deixados de fora da análise destacados em preto.

ANÁLISE DAS VARIÁVEIS
A análise das distintas variáveis para entender seu comportamento espacial e a relação
espacial autoregressiva é fundamental para compreender as complexidades das interações
entre diferentes fatores em estudos geoespaciais.
Em nosso processo de análise, tomamos a decisão estratégica de normalizar algumas
variáveis em relação à população. Essa escolha foi motivada pela necessidade de evitar alta
colinearidade entre as variáveis, garantindo uma análise mais precisa e interpretação eficaz
dos resultados.
Dentre as variáveis que passaram por essa normalização, destacam-se o Produto
Interno Bruto (PIB) e a ocupação, entre outras. Devido à inclusão da população em suas
formulações, optamos por criar variáveis per capita, representando de forma mais equitativa o
impacto dessas métricas em diferentes localidades.
Além disso, estendemos essa abordagem de normalização para nossa variável alvo, a
taxa de investidores. Ao dividir a quantidade de investidores pela população total, criamos
uma métrica que reflete a participação relativa dos habitantes de uma região no programa de
investimentos.
Essa normalização proporciona uma compreensão mais equitativa das variáveis em
estudo, permitindo uma análise mais aprofundada das relações e padrões espaciais sem ser
influenciada pela variação populacional nas diferentes regiões. Essa abordagem contribui
para resultados mais robustos e interpretações mais precisas em nossa análise.
O Índice de Moran é uma ferramenta estatística fundamental para explorar padrões de
autocorrelação espacial em conjuntos de dados geográficos. Desenvolvido por Patrick Alfred
Pierce Moran, esse índice fornece uma medida numérica que ajuda a entender se as
observações em uma determinada área estão mais relacionadas espacialmente do que seria
esperado ao acaso.
Ao contrário de uma análise que trata cada observação de forma independente, o
Índice de Moran considera a proximidade espacial entre as observações. Ele avalia se valores
similares tendem a ocorrer próximos uns dos outros, indicando uma autocorrelação positiva,
ou se valores discrepantes estão mais agrupados, indicando uma autocorrelação negativa.
A interpretação do índice é relativamente simples. Um valor próximo de 1 sugere que
há uma forte autocorrelação positiva, indicando a presença de clusters espaciais. Por outro
lado, um valor próximo de -1 indica uma forte autocorrelação negativa, indicando uma
dispersão uniforme ou a formação de clusters com características distintas. Um índice
próximo de 0 sugere que não há uma autocorrelação espacial significativa.
Essa medida é amplamente utilizada em disciplinas como geografia, ciência ambiental
e economia regional, onde a distribuição espacial dos dados é crucial para a compreensão dos
fenômenos estudados. A análise do Índice de Moran fornece insights valiosos sobre padrões
espaciais, identificando áreas de concentração ou dispersão de determinadas características, o
que é fundamental para o planejamento regional, análises urbanas e diversos campos de
pesquisa que consideram a dimensão geográfica.
Os resultados dos Índices de Moran para a quantidade de investidores, o total da
população e a taxa de investidores por município fornecem insights valiosos sobre os padrões
de autocorrelação espacial presentes nesses dados.
Total da População por Município
Figura 4: Lisa cluster map da variável total da população por município
I de Moran: 0,142
O Índice de Moran de 0,142 para o total da população indica uma autocorrelação

espacial mais fraca nessa variável em comparação com a quantidade de investidores. Isso
sugere que, embora haja alguma tendência de municípios próximos terem populações
semelhantes, essa tendência é menos pronunciada do que a observada na quantidade de
investidores.
Figura 5: Classificação por Quebras Naturais (Jenks) da variável total da população por município
Quantidade de Investidores por Município
Figura 6: Lisa cluster map da variável quantidade de investidores por município
I de Moran: 0,275
Este Índice sugere que há uma moderada autocorrelação espacial na quantidade de

investidores entre os municípios. Isso indica a presença de clusters ou padrões espaciais
significativos na distribuição da quantidade de investidores. Municípios próximos têm uma
tendência a apresentar valores semelhantes aos de investidores, sugerindo uma possível
influência espacial na participação no programa de investimentos.
Figura 7: Classificação por Quebras Naturais (Jenks) da variável quantidade de investidores por município
Taxa de Investidores por Município
Figura 8: Lisa cluster map da variável taxa de investidores por município
I de Moran: 0,610
Um Índice de Moran de 0,610 para a taxa de investidores por município é o resultado

mais notável. Esse valor alto indica uma forte autocorrelação espacial na taxa de investidores,
o que implica que municípios geograficamente próximos têm taxas de investidores similares.
Isso sugere a presença de clusters significativos na participação no programa de
investimentos quando ajustado para a população local.
Esses resultados indicam que, ao normalizar a quantidade de investidores pela
população, a análise tornou-se mais sensível à distribuição espacial, revelando padrões que
podem ter sido menos evidentes ao analisar diretamente a quantidade bruta de investidores ou
o total da população. Essa abordagem permite uma compreensão mais refinada dos fatores
espaciais que influenciam a participação no programa de investimentos, fornecendo
informações úteis para tomadas de decisão em políticas públicas e estratégias de investimento
em nível municipal.
Figura 9: Classificação por Quebras Naturais (Jenks) da variável taxa de investidores por município
Taxa de analfabetismo
Figura 10: Lisa cluster map da variável taxa de analfabetismo
I de Moran: 0,845
O Índice de Moran de 0,845 para a Taxa de Analfabetismo evidencia a maior

correlação espacial em todo o projeto. Essa pontuação expressa fortemente a tendência de
áreas vizinhas a compartilharem taxas de analfabetismo semelhantes. Esta marcante
correlação sugere agrupamentos geográficos importantes que requerem atenção para
intervenções educacionais localizadas.
Figura 11: Classificação por Quebras Naturais (Jenks) da variável taxa de analfabetismo
IDH
Figura 12: Lisa cluster map da variável IDH
I de Moran: 0,471
Com um Índice de Moran de 0,471, a distribuição espacial do IDH aponta para uma
associação espacial moderada. Municípios próximos exibem padrões semelhantes no IDH,
indicando agrupamentos que podem estar relacionados a fatores socioeconômicos
compartilhados. Esta informação é crucial para entender as variações na qualidade de vida na
região estudada.
Figura 13: Classificação por Quebras Naturais (Jenks) da variável IDH

Taxa de trabalhadores ocupados
Figura 14: Lisa cluster map da variável taxa de trabalhadores ocupados
I de Moran: 0,488
O Índice de Moran de 0,488 para a Taxa de Trabalhadores Ocupados sugere uma

correlação espacial intensa. A proximidade geográfica entre municípios está associada a
padrões semelhantes de empregabilidade. Esta observação pode indicar áreas com diferentes
dinâmicas econômicas, influenciando políticas de emprego e desenvolvimento local.
Figura 15: Classificação por Quebras Naturais (Jenks) da variável taxa de trabalhadores ocupados
Taxa de saneamento básico
Figura 16: Lisa cluster map da variável taxa de saneamento básico
I de Moran: 0,488
Com um Índice de Moran de 0,488, a Taxa de Saneamento Básico revela uma forte
correlação espacial. Municípios próximos apresentam padrões similares de acesso ao
saneamento básico. Esses insights são fundamentais para a implementação eficiente de
políticas públicas voltadas para infraestrutura sanitária.
Figura 17: Classificação por Quebras Naturais (Jenks) da variável taxa de saneamento básico
Total de ações compradas no TD
Figura 18: Lisa cluster map da variável total de ações compradas no tesouro direto
I de Moran: 0,113
O Índice de Moran de 0,113 indica uma correlação espacial menos acentuada no total
de ações adquiridas no Tesouro Direto, em comparação com outras variáveis de investimento.
Isso sugere uma tendência mais fraca de municípios próximos possuírem volumes
semelhantes de ações compradas no TD.
Figura 19: Classificação por Quebras Naturais (Jenks) da variável total de ações compradas no tesouro direto
Total de ações vendidas no TD
Figura 20: Lisa cluster map da variável total de ações vendidas no tesouro direto
I de Moran: 0,102
Com um Índice de Moran de 0,102, a correlação espacial nas vendas de ações no

Tesouro Direto é relativamente baixa. Isso indica que a distribuição geográfica das vendas de
ações no TD não segue padrões espaciais proeminentes.
Figura 21: Classificação por Quebras Naturais (Jenks) da variável total de ações vendidas no tesouro direto
Renda média
Figura 22: Lisa cluster map da variável renda média
I de Moran: 0,755
O Índice de Moran de 0,755 para a Renda Média demonstra uma grandiosa correlação
espacial. Municípios próximos compartilham padrões semelhantes de renda média,
apontando para agrupamentos espaciais relevantes que impactam estratégias de
desenvolvimento econômico e alocação de recursos.
Figura 23: Classificação por Quebras Naturais (Jenks) da variável renda média
PIB per Capita
Figura 24: Lisa cluster map da variável pib per capita
I de Moran: 0,327
Com um Índice de Moran de 0,327, a distribuição espacial do PIB per Capita mostra
uma correlação muito relevante. Municípios próximos tendem a exibir valores semelhantes
de PIB per Capita, sugerindo a presença de agrupamentos associados a dinâmicas econômicas
comuns.
Figura 25: Classificação por Quebras Naturais (Jenks) da variável pib per capita
Salário médio mensal dos trabalhadores
Figura 26: Lisa cluster map da variável salário médio mensal dos trabalhadores
I de Moran: 0,361
O Índice de Moran de 0,361 indica uma associação espacial acentuada no salário

médio mensal dos trabalhadores. Isso sugere que a proximidade geográfica está ligada a
padrões similares de remuneração, sendo relevante para estratégias de desenvolvimento
econômico e equidade salarial.
Figura 27: Classificação por Quebras Naturais (Jenks) da variável salário médio mensal dos trabalhadores
Quantidade de agências bancárias
Figura 28: Lisa cluster map da variável quantidade de agências bancárias
I de Moran: 0,066
Com um Índice de Moran de 0,066, a correlação espacial na distribuição de agências

bancárias é consideravelmente baixa. Isso sugere que a presença de agências bancárias não
segue padrões espaciais proeminentes, o que pode impactar estratégias de acesso a serviços
financeiros.
Figura 29: Classificação por Quebras Naturais (Jenks) da variável quantidade de agências bancárias
MODELAGEM ESTATÍSTICA
Para este trabalho vamos testar três modelos estatísticos que destacam-se nesse
contexto, oferecendo abordagens distintas para a análise espacial:
A regressão linear múltipla é um modelo estatístico clássico que estabelece uma
relação linear entre uma variáveis independentes e uma variável dependente. No contexto
espacial, este modelo é essencial para entender como uma variável específica se comporta em
relação a outra, permitindo a identificação de padrões e a quantificação da intensidade da
relação entre essas variáveis em diferentes locais.
Portanto, ao conduzir uma análise de regressão linear múltipla em um contexto
espacial, é crucial não apenas estimar os parâmetros do modelo, mas também examinar e
diagnosticar a presença de padrões espaciais nos resíduos, garantindo assim uma
interpretação robusta dos resultados.
O Modelo SAR (Spatial Auto-Regressive) é uma ferramenta estatística poderosa que
expande a regressão linear para incorporar a autocorrelação espacial. Esse modelo é
especialmente valioso quando há a suspeita de que observações em locais geograficamente
próximos podem influenciar umas às outras. Ao contrário da regressão linear múltipla, o SAR
leva em consideração explicitamente a proximidade espacial como um fator que influencia a
relação entre o SAR permite capturar padrões espaciais que podem ser cruciais para a
compreensão de fenômenos em que a proximidade geográfica desempenha um papel
significativo. Por exemplo, em estudos urbanos e ambientais, onde características de uma
área podem impactar diretamente as áreas circunvizinhas, o Modelo SAR pode fornecer uma
representação mais precisa das relações espaciais.
A análise de diagnóstico no SAR inclui a exploração de padrões residuais espaciais
para assegurar a validade do modelo. Essa metodologia é vital para garantir que a
autocorrelação espacial seja adequadamente modelada, fornecendo resultados mais robustos e
confiáveis em contextos nos quais a proximidade geográfica desempenha um papel
significativo.
O Modelo SEM (Spatial Error Model) é uma abordagem sofisticada na análise
espacial, diferenciando-se do Modelo SAR ao incorporar a autocorrelação espacial através de
termos de erro espacial. Enquanto o SAR modela a dependência espacial nas variáveis
dependentes, o SEM concentra-se nos erros residuais, capturando assim a variação não
explicada nas variáveis dependentes. Isso faz do SEM uma ferramenta valiosa para situações
em que a autocorrelação espacial é mais apropriada na representação dos resíduos do modelo.
O Modelo SEM é particularmente útil quando a variação espacial não explicada nos
resíduos é relevante para a análise. Ao capturar os padrões espaciais nos erros, o SEM
proporciona uma representação mais realista da complexidade espacial dos dados.
A escolha entre Regressão Linear Múltipla, Modelo SAR e Modelo SEM depende das
características dos dados, das hipóteses sobre a estrutura espacial subjacente e dos objetivos
específicos da análise. Em conjunto, esses modelos oferecem um arsenal poderoso para
explorar as relações espaciais entre variáveis, sendo indispensáveis para pesquisas que
buscam compreender a dinâmica complexa dos fenômenos em estudo, especialmente em
contextos nos quais a influência espacial desempenha um papel significativo.
Para os modelos com componente autoregressiva espacial é necessário definir um
critério de contiguidade espacial. Este critério estabelece uma definição específica de
vizinhança entre áreas geográficas, como distritos, municípios ou unidades administrativas, e
é amplamente empregado para explorar e compreender padrões espaciais.
Neste trabalho vamos usar a Matriz de Vizinhança Queen que reside na consideração
de que duas áreas são consideradas vizinhas se compartilham uma fronteira ou um vértice em
comum. Isso significa que, para um par de áreas, elas são consideradas contíguas se
compartilham uma borda ou um ponto de conexão, seja um vértice. Esse critério de
contiguidade é chamado de "Rainha" porque todas as áreas que compartilham um ponto ou
borda com a área de interesse são consideradas vizinhas, de forma semelhante aos
movimentos possíveis de uma rainha no jogo de xadrez.
Essa matriz é instrumental em muitas análises espaciais, especialmente quando se
trata de estatísticas espaciais globais ou locais, como autocorrelação espacial ou análises de
clusters. Além disso, é fundamental em modelos espaciais que levam em conta a estrutura
espacial das unidades, como os modelos SAR e SEM discutidos anteriormente. A Matriz de
Vizinhança Queen fornece a base para definir as relações espaciais entre as unidades,
permitindo assim a incorporação da influência espacial nas análises e modelos.
Regressão Linear Múltipla
Ao executar o modelo de regressão linear múltipla, foram obtido os seguintes

resultados:
Variable Coefficient Std.Error t-Statistic Probability
β0 Intercepto -0.511543 0.0361426 -14.1535 0.00
β1 Total de ações compradas 3.87E-09 5.86E-10 6.59663 0.00
β2 Total de ações vendidas -5.54E-09 1.01E-09 -5.51146 0.00

Quantidade de agências
β3 bancárias -0.00156356 0.000418932 -3.73226 0.00
β4 Renda média 0.000844392 3.85E-05 21.9106 0.00
β5 Salário médio mensal 0.0177914 0.00891833 1.99493 0.05
β6 PIB per capita -9.18E-07 1.46E-07 -6.26648 0.00
β7 Taxa de analfabetismo -0.00139503 0.00052465 -2.65898 0.01
β8 Taxa de saneamento básico 0.378161 0.02386 15.8492 0.00

Taxa de trabalhadores
β9 ocupados 0.0102177 0.000468845 21.7933 0.00
β10 IDH 0.305125 0.0571854 5.33572 0.00

Tabela 2: Resultado do modelo de regressão múltipla
As variáveis salário médio mensal e taxa de analfabetismo foram consideradas não

significativas, portanto foram retiradas do modelo. O R² após a remoção ficou em 67,46%.
Modelo SEM (Spatial Error Model)
Ao executar o modelo de spatial error, foram obtido os seguintes resultados:
Variable Coefficient Std.Error z-value Probability
β0 Intercepto -0.40522 0.0322925 -12.5484 0.00
β1 Total de ações compradas -3.72E-10 4.46E-10 -0.834467 0.40
β2 Total de ações vendidas 1.43E-10 7.57E-10 0.189119 0.85

β3 bancárias -0.000650256 0.000295485 -2.20064 0.03
β4 Renda média 0.00123764 3.64E-05 33.9597 0.00
β7 Taxa de analfabetismo -0.00410958 0.000648092 -6.34104 0.00

β9 ocupados 0.00823926 0.000379283 21.7232 0.00
β10 IDH 0.118044 0.0477989 2.4696 0.00
µ Parâmetro de erro 0.712583 0.0120711 59.0323 0.00

Tabela 3: Resultado do modelo de spatial error
As variáveis total de ações compradas, total de ações vendidas, quantidade de

agências bancárias e salário médio mensal foram consideradas não significativas, portanto
foram retiradas do modelo. O R² após a remoção ficou em 78,16%.
Modelo SAR (Spatial Auto-Regressive)
Ao executar o modelo spatial auto-regressive, foram obtido os seguintes resultados:
Variable Coefficient Std.Error z-value Probability
ρ Variável auto-regressiva 0.37548 0.0129206 29.0605 0.00
β0 Intercepto -0.578587 0.0328666 -17.6041 0.00
β1 Total de ações compradas 4.57E-09 5.36E-10 8.51691 0.00
β2 Total de ações vendidas -6.96E-09 9.19E-10 -7.57489 0.00

β3 bancárias -0.000764914 0.000381007 -2.00761 0.04
β4 Renda média 0.000661234 3.69E-05 17.9004 0.00
β7 Taxa de analfabetismo 0.00275976 0.000490012 5.63203 0.00

β9 ocupados 0.00928121 0.000426824 21.7448 0.00
β10 IDH 0.232049 0.0519904 4.46332 0.00

Tabela 4: Resultado do modelo spatial auto-regressive
As variáveis quantidade de agências bancárias e salário médio mensal foram

consideradas não significativas, portanto foram retiradas do modelo. O R² após a remoção
ficou em 73,07%.
A equação final do modelo spatial auto-regressive ficou da seguinte forma:
y = β0 + β1d1 + β2d2 + β4d4 + β6d6 + β7d7 + β8d8 + β9d9 + β10d10 + ρWy + ε

CONCLUSÃO
Ao analisar a relação entre variáveis socioeconômicas e a taxa de investidores em

Tesouro Direto, os dados coletados e tratados a nível municipal revelaram insights notáveis.
Utilizando o modelo de Equações Simultâneas (SEM), observou-se um ajuste significativo
representado por um elevado coeficiente de determinação (R²). Este resultado sugere que o
modelo SEM é eficaz em capturar a complexidade e as nuances da relação entre as variáveis
socioeconômicas e o comportamento dos investidores, oferecendo uma compreensão
aprofundada de como diferentes fatores podem influenciar a decisão de investir em títulos do
Tesouro Direto.
No entanto, na prática, o modelo de Autocorrelação Espacial (SAR) apresentou-se
como uma opção mais viável, apesar de seu R² ligeiramente inferior (5 pontos percentuais a
menos) em comparação com o modelo SEM. Esta discrepância entre a teoria e a prática é um
lembrete valioso da complexidade inerente à modelagem de dados econômicos. O modelo
SAR, sendo mais aplicável na prática, oferece uma representação mais realista das relações
espaciais entre as variáveis, o que é crucial para entender como as tendências de investimento
se propagam através de diferentes regiões e comunidades.
Para aprimorar ainda mais a precisão e relevância do modelo, uma proposta
interessante seria a incorporação dos dados atualizados do Instituto Brasileiro de Geografia e
Estatística (IBGE). Ao realizar essa atualização, pode-se avaliar como o modelo prediz a taxa
de investidores em um ano subsequente, fornecendo uma medida da robustez e da
confiabilidade das previsões do modelo. Esta abordagem não só validaria o modelo com
dados mais recentes, mas também forneceria insights valiosos sobre as tendências futuras de
investimento no Tesouro Direto.
Considerando os resultados promissores deste estudo, ele pode se tornar um recurso
valioso para corretoras e instituições financeiras. Com um modelo capaz de prever com
precisão a taxa de investidores no Tesouro Direto, as corretoras poderiam desenvolver
estratégias mais eficientes e direcionadas para atender às necessidades de seus clientes. Este
modelo não só ajudaria a identificar áreas com potencial de crescimento, mas também
possibilitaria a criação de ofertas e serviços personalizados, alinhados com as preferências e
comportamentos dos investidores. Assim, a aplicação prática deste modelo tem o potencial de
transformar significativamente a maneira como as corretoras interagem com o mercado e
atendem aos seus clientes.
Além do mais, A pandemia de COVID-19 trouxe consigo uma série de mudanças
significativas no comportamento de investidores, sendo uma delas o crescente interesse por
opções de investimento mais seguras. Entre estas, o Tesouro Direto se destacou como uma
escolha popular, atraindo um número crescente de investidores que buscam refúgio em meio
à incerteza econômica. Este fenômeno é reflexo da busca por estabilidade em tempos de
crise, onde investimentos considerados de menor risco se tornam especialmente atraentes. Em
próximos estudos pode-se estudar mais a fundo as influências espaciais nas mudanças de
hábitos dos investidores brasileiros.
REFERÊNCIAS BIBLIOGRÁFICAS
B3 - BRASIL, BOLSA, BALCÃO. Perfil Pessoa Física. Disponível em:

https://www.b3.com.br/pt_br/market-data-e-indices/servicos-de-dados/market-data/consultas/
mercado-a-vista/perfil-pessoas-fisicas/perfil-pessoa-fisica/. Acesso em: 05/12/2023
GEOKRIGAGEM. Como calcular o índice Moran (Autocorrelação Espacial). Disponível em:

https://geokrigagem.com.br/como-calcular-o-indice-moran-autocorrelacao-espacial/. Acesso
em: 28/11/2023
COMPLETAR

Resenha - TD X Estatística Espacial

Enviado por

Direitos autorais:

Formatos disponíveis

Resenha - TD X Estatística Espacial

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Resenha - TD X Estatística Espacial

Enviado por

Direitos autorais:

Formatos disponíveis

Investindo no Brasil: Análise espacial dos investidores do Tesouro Direto e

seu contexto socioeconômico.

Fundação Getulio Vargas

Figura 1: Evolução dos investimentos de pessoa física

Em uma década aproximadamente, o programa do Tesouro Direto registrou uma

Tabela 1: Variáveis escolhidas

Figura 3: Municípios deixados de fora da análise destacados em preto.

Figura 4: Lisa cluster map da variável total da população por município

O Índice de Moran de 0,142 para o total da população indica uma autocorrelação

Figura 6: Lisa cluster map da variável quantidade de investidores por município

Este Índice sugere que há uma moderada autocorrelação espacial na quantidade de

Figura 8: Lisa cluster map da variável taxa de investidores por município

Um Índice de Moran de 0,610 para a taxa de investidores por município é o resultado

Figura 10: Lisa cluster map da variável taxa de analfabetismo

O Índice de Moran de 0,845 para a Taxa de Analfabetismo evidencia a maior

Figura 12: Lisa cluster map da variável IDH

Figura 13: Classificação por Quebras Naturais (Jenks) da variável IDH

Figura 14: Lisa cluster map da variável taxa de trabalhadores ocupados

O Índice de Moran de 0,488 para a Taxa de Trabalhadores Ocupados sugere uma

Figura 16: Lisa cluster map da variável taxa de saneamento básico

Com um Índice de Moran de 0,102, a correlação espacial nas vendas de ações no

Figura 22: Lisa cluster map da variável renda média

Figura 24: Lisa cluster map da variável pib per capita

O Índice de Moran de 0,361 indica uma associação espacial acentuada no salário

Figura 28: Lisa cluster map da variável quantidade de agências bancárias

Com um Índice de Moran de 0,066, a correlação espacial na distribuição de agências

Ao executar o modelo de regressão linear múltipla, foram obtido os seguintes

Variable Coefficient Std.Error t-Statistic Probability

β0 Intercepto -0.511543 0.0361426 -14.1535 0.00

β1 Total de ações compradas 3.87E-09 5.86E-10 6.59663 0.00

β2 Total de ações vendidas -5.54E-09 1.01E-09 -5.51146 0.00

β4 Renda média 0.000844392 3.85E-05 21.9106 0.00

β5 Salário médio mensal 0.0177914 0.00891833 1.99493 0.05

β6 PIB per capita -9.18E-07 1.46E-07 -6.26648 0.00

β7 Taxa de analfabetismo -0.00139503 0.00052465 -2.65898 0.01

β8 Taxa de saneamento básico 0.378161 0.02386 15.8492 0.00

β10 IDH 0.305125 0.0571854 5.33572 0.00

As variáveis salário médio mensal e taxa de analfabetismo foram consideradas não

Ao executar o modelo de spatial error, foram obtido os seguintes resultados:

Variable Coefficient Std.Error z-value Probability

β0 Intercepto -0.40522 0.0322925 -12.5484 0.00

β1 Total de ações compradas -3.72E-10 4.46E-10 -0.834467 0.40

β2 Total de ações vendidas 1.43E-10 7.57E-10 0.189119 0.85

β4 Renda média 0.00123764 3.64E-05 33.9597 0.00

β5 Salário médio mensal 0.0156576 0.00770012 2.03343 0.04

β6 PIB per capita -6.71E-07 1.19E-07 -5.62294 0.00

β7 Taxa de analfabetismo -0.00410958 0.000648092 -6.34104 0.00

β8 Taxa de saneamento básico 0.27659 0.0231442 11.9508 0.00

β10 IDH 0.118044 0.0477989 2.4696 0.00

µ Parâmetro de erro 0.712583 0.0120711 59.0323 0.00

As variáveis total de ações compradas, total de ações vendidas, quantidade de

Ao executar o modelo spatial auto-regressive, foram obtido os seguintes resultados:

Variable Coefficient Std.Error z-value Probability

ρ Variável auto-regressiva 0.37548 0.0129206 29.0605 0.00

β0 Intercepto -0.578587 0.0328666 -17.6041 0.00

β1 Total de ações compradas 4.57E-09 5.36E-10 8.51691 0.00

β2 Total de ações vendidas -6.96E-09 9.19E-10 -7.57489 0.00

β4 Renda média 0.000661234 3.69E-05 17.9004 0.00

β5 Salário médio mensal 0.0127684 0.00811135 1.57415 0.12