0
UNIVERSIDADE FEDERAL DA PARAÍBA - UFPB
PROGRAMA DE PÓS-GRADUAÇÃO EM ECONOMIA - PPGE
CURSO DE DOUTORADO EM ECONOMIA - CME
TRÊS ENSAIOS EM ECONOMIA SOCIAL
Linha de Pesquisa: Economia Regional e Políticas Públicas
FERNANDA LEITE SANTANA
JOÃO PESSOA – PB
2016
1
FERNANDA LEITE SANTANA
TRÊS ENSAIOS EM ECONOMIA SOCIAL
Tese apresentada ao Programa de Pós-Graduação em
Economia (PPGE) da Universidade Federal da Paraíba
(UFPB), como requisito para obtenção do título de
Doutor(a) em Economia.
Orientador:
Figueiredo
Professor
JOÃO PESSOA – PB
2016
Pós-Dr.
Erik
Alencar
de
2
3
Folha de Aprovação
4
Aquilo que vivemos no sonho, e que nele vivemos repetidas
vezes, termina por pertencer à economia global de nossa
alma, tanto quanto algo “realmente” vivido.
Nietzche
5
AGRADECIMENTOS
Parece clichê, mas não tenho como fugir da afirmação de que a elaboração deste
trabalho compreendeu muito mais que a titulação de doutora, pois foram envolvidas inúmeras
pessoas e instituições, sem as quais eu não poderia estar realizando esse sonho.
Certo dia, nos meus anseios por escritas inspiradoras dessa jornada, li um texto que
fala do terrível custo de se fazer um doutorado, abordando as sequelas e os efeitos
psicológicos adquiridos ao longo do processo, mas que em nenhum momento o vi abordando
o apoio e as amizades que se conquistam nesse tempo.
Nesse sentido, parafraseando os conteúdos dos livros de econometria que me deparei
ao longo do curso, posso afirmar que apesar do doutorado ser um resultado robusto, não tem
como estimar a significância das pessoas na determinação do mesmo como se fosse uma
simples regressão, pois aprendi que relacionamentos não são determinísticos.
E, por mais dolorido que possa ter sido, o que fica é uma imensa gratidão como
reconhecimento de que, por mais que um trabalho acadêmico possa parecer individual, ele é
na sua essência fruto de muitos esforços individuais e coletivos. E nessa conjuntura, externo
aqui meus agradecimentos:
À Deus, por fazer parte da minha vida em todos os momentos.
À minha família, meus pais Margarida e Marinaldo pela cooperação e paciência
durante todo o curso e por acreditar no meu potencial para concluir essa etapa. Aos meus
irmãos André Luiz e Thyago pelo apoio.
À família de Jairo, que também posso chamar de minha família, vivenciaram comigo
momentos de alegria e amor fraterno que jamais poderei esquecer.
Aos amigos acadêmicos que os levarei no coração para o resto da minha vida, Patrícia
Soares, Etevaldo Almeida, Ana Annegues, Wallace Patrick, Herbert Vinícius, Paola Freire e
Herbert Rêgo. Foram momentos inesquecíveis.
À Erik Alencar, orientador, obrigado pela compreensão e paciência nos momentos
difíceis que me deparei ao longo deste trabalho. Sua prontidão e disponibilidade online foram
essências para mim. Meu muito obrigado!
Aos pesquisadores: Francisco Soares de Lima, Jorge Luiz Mariano da Silva, José Luís
da Silva Netto Júnior e Shirley Pereira de Mesquita, pela disponibilidade de participar da
avaliação deste trabalho.
Aos funcionários do PPGE-UFPB, Risomar Farias e Ricardo, pela presteza e
amabilidade nas demandas requeridas.
6
À Conselheira-Presidente do Tribunal de Contas do Estado do Acre – TCE-AC, Naluh
Maria Lima Gouveia, pela oportunidade concedida em encerrar esta etapa da minha vida. Sou
eternamente grata por sua sensibilidade a minha demanda.
Aos amigos que fiz no TCE-AC, em especial a minha chefe Semírames Maria
Plácido Dias, por acreditar em mim, como também pelo apoio da Laelia, Kelly e Marnízia e
demais amigos da 2ª Inspetoria.
Agradecimento Especial
Ao meu esposo Jairo, amigo de todas as horas com o qual pude compartilhar sonhos e
conquistas ao longo dos 14 anos de estrada que temos. Sem a sua reciprocidade e
companheirismo eu não chegaria a tal ponto.
7
RESUMO
Este trabalho é composto por três artigos na área de Economia Social, que se dedicam a
estudar três identificações empíricas sob o escopo de estimadores com controles individuais
para efeitos individuais. Para tanto, constroem-se painéis quantílicos para cada desenho
empírico conforme a literatura existente e o arcabouço teórico. No primeiro ensaio
investigam-se os efeitos do tamanho da turma no desempenho acadêmico dos universitários
que ingressaram na UFPB no período de 2001 à 2010. Para estimadores condicionais a
mediana, os resultados sugerem uma relação negativa entre o tamanho da classe e o
desempenho acadêmico, levando a concluir que políticas de redução de turma teria um efeito
benéfico no desempenho acadêmico dos alunos da UFPB. Contudo, ao utilizar o estimador
QR(FE), averígua-se um valor superestimado desse efeito decorrente do viés do estimador
padrão por não captar a heterogeneidade não observada. Além disso, a análise ao longo da
distribuição condicional de desempenho evidencia que existe heterogeneidade de efeitos. Os
resultados aqui evidenciados além de trazer novos elementos para as politicas públicas,
também abrem uma agenda de pesquisa relevante em virtude da falta de consenso na literatura
do efeito da variável de interesse. Por sua vez, o segundo ensaio traz a luz questões sobre os
determinantes do desempenho acadêmico dos universitários ao analisar a relação causal entre
a disponibilidade de água pluvial no período gestacional dos indivíduos nascidos no semiárido
brasileiro e o resultado educacional individual. O pressuposto é de que as chuvas em ano de
nascimento tem relação positiva com o desenvolvimento das habilidades cognitivas e não
cognitivas dos indivíduos quando adultos. Neste cenário, análogo a análise anterior, o
estimador condicional à mediana superestima o efeito da variável de interesse, à qual consiste
no log-desvio das chuvas 12 meses antes do nascimento do indivíduo. No geral, tem-se que o
efeito é positivo, bem como persistente ao longo da distribuição condicional de desempenho
acadêmico. Tais constatações são relevantes às políticas públicas, pois evidenciam que
investimentos em idades precoces têm efeito maior do que investimentos feitos mais tarde, o
que levanta questões sobre o papel de políticas de acesso ao ensino superior, sistema de cotas,
entre outros. Por fim, o terceiro ensaio contribui para as políticas públicas ao ressaltar a
importância das questões climáticas nos resultados de saúde. Para avaliar os efeitos das
chuvas, realizaram-se três exercícios empíricos: i) estimador de regressão quantílica com
efeitos fixos ii) estimador de regressão quantílica com efeitos fixos e variáveis instrumentais;
iii) dados de precipitação observacional. Os resultados sugerem que: i) quanto maior a
precipitação antes da concepção, durante o período gestacional e nos primeiros anos de vida
dos indivíduos menor é a taxa de mortalidade infantil nesta região; ii) quando controlada a
heterogeneidade não observada e a endogeneidade existente na relação, a precipitação tem
menor peso indicando que métodos condicionais à média superestimam essa relação. Em
síntese, os resultados corroboram com a literatura de que os bebês nascidos nas zonas áridas e
que passam por períodos de seca quando no útero de suas mães enfrentam risco maior de
morte, especialmente quando as secas comprometem os períodos antes e após a concepção
dos indivíduos.
Palavras-chaves: Economia Social; Regressão Quantílica com Efeitos Fixos; Tamanho da
Turma; Precipitação; Desempenho Acadêmico; Mortalidade Infantil.
8
ABSTRACT
This work consists of three articles in the area of social economics, which are dedicated to
study three empirical identifications under the scope of estimators with individual controls for
individual effects. For this purpose, are constructed quantile panels for each empirical design
as the existing literature and theoretical framework. In the first trial we investigate the effects
of class size on academic performance of students who entered the UFPB from 2001 to 2010.
For conditional estimates of the median, the results suggest a negative relationship between
class size and academic performance, leading to the conclusion that class reduction policies
would have a beneficial effect on the academic performance of UFPB students. However,
when using the estimator QR (FE), we find out a overestimated value of this effect resulting
from the standard estimator bias, because it does not capture the unobserved heterogeneity.
Furthermore, analysis along the conditional distribution performance demonstrates that there
is heterogeneity effects. The results highlighted here bring new elements to public policy and
also open a relevant research agenda because of the lack of consensus in the literature of the
effect of the variable of interest. In turn, the second trial brings to light questions about the
determinants of academic performance of students analyzing the causal relationship between
the rain water availability during pregnancy of individuals born in the Brazilian semi-arid and
individual educational outcome. The assumption is that the rains in year of birth has a positive
relationship with the development of cognitive and non-cognitive skills of individuals as
adults. In this scenario, similar to the previous analysis, the conditional median estimator
overestimate the effect of the variable of interest, which is the log deviation of rain 12 months
before the birth of the individual. In general, the effect is positive, as well as persists along the
conditional distribution of academic achievement. Such findings are relevant for public
policies as evidence that investment in early childhood has a greater effect than investments
done later, which raises questions about the role of access policies to higher education, as the
quota system, among others. Finally, the third test contributes to public policies to emphasize
the importance of climate issues in health outcomes. To assess the effects of rain, we make
three empirical exercises: i) quantile regression estimator with fixed effects ii) quantile
regression estimator with fixed effects and instrumental variables; iii) observational
precipitation data. The results suggest that: i) the higher the rainfall before conception, during
pregnancy and the first years of life of individuals, the lowest infant mortality rate in the
region; ii) when controlling the unobserved heterogeneity and endogeneity in the relationship,
the rainfall has less weight indicating that methods conditional to mean overestimate this
relationship. In summary, the results corroborate the literature that babies born in arid and go
through periods of drought when in the womb of their mothers face greater risk of death,
especially when drought undertake the periods before and after conception of individuals .
Keywords: Social Economics; Quantile regression with fixed effects; Size of the Group;
Precipitation; Academic performance; Child mortality.
9
LISTA DE TABELAS
ENSAIO 1
Tabela 1.1 -
Perfil do aluno da UFPB de 2001 à 2010 ......................................
18
Tabela 1.2 -
Número de docentes por Centro Acadêmico e por Titulação ........
19
Tabela 1.3 -
Estatísticas Descritivas Geral .........................................................
22
Tabela 1.4 -
Estatística Descritiva por Centro Acadêmico – Média ..................
23
Tabela 1.5 -
Resultados Empíricos para a mediana ...........................................
26
ENSAIO 2
Tabela 2.1 -
Estatística Descritiva ......................................................................
50
Tabela 2.2 -
Resultados das estimações .............................................................
52
ENSAIO 3
Tabela 3.1 -
Correlação de Spearman entre dados de Precipitação de TSM
71
Tabela 3.2 -
Resultados das estimações com método de Canay (2011) do
período de 1996-2010 da Região Semiárida do Nordeste .............
73
Tabela 3.3 -
Resultados das estimações com método de Harding e Lamarche
(2009) do período de 1996-2010 da Região Semiárida do
Nordeste .........................................................................................
76
Tabela 3.4 -
Resultados das estimações de comparação de dados de Reanálise
e Observacionais do período de 1996-2010 da Região Semiárida
do Nordeste
78
10
LISTA DE GRÁFICOS
ENSAIO 1
Gráfico 1.1
Gráfico 1.2
Gráfico 1.3
Gráfico 1.4
Estimativas do impacto do tamanho da classe no desempenho
acadêmico dos indivíduos ao longo da distribuição ......................
Estimativas ao logo da distribuição por centro acadêmico –
CCEN, CCTA e CCS .....................................................................
Estimativas ao logo da distribuição por centro acadêmico –
CCSA, CCHLA ..............................................................................
Efeitos quantílicos das covariáveis sobre o desempenho
acadêmico ......................................................................................
27
28
29
30
ENSAIO 2
Gráfico 2.1 Evolução por quantis dos coeficientes estimados por QR(FE) .....
53
ENSAIO 3
Gráfico 3.1
Estimativas do impacto das secas sob os resultados dos
indivíduos ao longo da distribuição ...............................................
75
11
LISTA DE QUADROS
ENSAIO 2
Quadro 2.1 Descrição das Variáveis .................................................................
48
ENSAIO 3
Quadro 3.1
Diversas Fontes e Metodologias de dados de
Precipitação......................................................................................
68
12
SUMÁRIO
INTRODUÇÃO .................................................................................................
CAPÍTULO 1: O Impacto do Tamanho da Classe no Desempenho
Acadêmico Superior: Efeitos Condicionais Heterogêneos .................................
13
14
Resumo --------------------------------------------------------------------------------
14
Abstract --------------------------------------------------------------------------------
14
1.1 Introdução ----------------------------------------------------------------------------
15
1.2 Contexto Institucional e Perfil do Aluno ----------------------------------------
17
1.3 Estratégia Empírica e Dados ------------------------------------------------------
21
1.3.1 Estratégia empírica -----------------------------------------------------------
21
1.3.2 Descrição dos Dados ----------------------------------------------------------
23
1.4 Resultado e Discussões ------------------------------------------------------------
26
1.4.1 Linha Base ----------------------------------------------------------------------
26
1.4.2 Política de Redução do Tamanho da turma por Centro Acadêmico ---
29
1.4.3 Efeitos das Covariáveis -------------------------------------------------------
31
1.5 Considerações Finais ---------------------------------------------------------------
33
1.6 Referências Bibliográficas ---------------------------------------------------------
34
Apêndice -------------------------------------------------------------------------------
36
Anexo ----------------------------------------------------------------------------------
37
CAPÍTULO 2: Escassez de água e os Resultados Educacionais dos
Universitários do Semiárido Brasileiro ..............................................................
38
Resumo --------------------------------------------------------------------------------
38
Abstract --------------------------------------------------------------------------------
38
2.1 Introdução ----------------------------------------------------------------------------
39
2.2 Formação de Capacidades ---------------------------------------------------------
41
2.1 Formação de Habilidades: Psicologia, Economia, Neurociência e
Saúde --------------------------------------------------------------------------------------
41
2.2 Estratégia de Identificação Empírica ---------------------------------------------
45
2.2.1 Modelo Teórico ----------------------------------------------------------------
45
2.2.2 Identificação Empírica --------------------------------------------------------
46
13
2.2.3 Descrição dos Dados ----------------------------------------------------------
48
2.3 Resultados ---------------------------------------------------------------------------
51
2.3.1 Estatística Descritivas --------------------------------------------------------
51
2.3.2 Efeitos das secas no desempenho acadêmico ------------------------------
52
2.4 Considerações Finais ---------------------------------------------------------------
56
2.5 Referências Bibliográficas ---------------------------------------------------------
57
CAPÍTULO 3: Escassez da Água e Mortalidade Infantil: Novas Evidências a
partir de um Painel Quantílico Robusto ----------------------------------------------
60
Resumo --------------------------------------------------------------------------------
60
Abstract --------------------------------------------------------------------------------
60
3.1 Introdução ----------------------------------------------------------------------------
61
3.2 Metodologia e Dados ---------------------------------------------------------------
64
3.2.1 Contexto -------------------------------------------------------------------------
64
3.2.2 Estratégia Empírica -----------------------------------------------------------
65
3.2.3 Descrição dos Dados ----------------------------------------------------------
68
3.3 Resultados Empíricos --------------------------------------------------------------
73
3.3.1 Heterogeneidade não observada --------------------------------------------
73
3.3.2 Endogeneidade -----------------------------------------------------------------
77
3.3.2 Dados Observacionais --------------------------------------------------------
78
2.4 Considerações Finais ---------------------------------------------------------------
81
2.5 Referências Bibliográficas ---------------------------------------------------------
82
Anexo ----------------------------------------------------------------------------------
85
CONSIDERAÇÕES FINAIS ...........................................................................
86
14
INTRODUÇÃO
O objetivo da tese concentra-se em utilizar técnicas de identificação econométricas,
em especial, estimadores com controles individuais para efeitos individuais, focando em
temas de economia social sob o ponto de vista das políticas públicas. Especificamente, buscase adicionar elementos à literatura da economia da educação no primeiro e segundo ensaio e à
economia da saúde no terceiro ensaio, fornecendo insights sobre a distribuição condicional
dos resultados econômicos em educação e saúde, respectivamente.
O primeiro ensaio tem-se como propósito averiguar os efeitos do tamanho da turma no
desempenho acadêmico dos indivíduos. Em cenário onde a literatura sobre o tema é limitada e
ainda não explorada para o ensino superior do Brasil, este trabalho acrescenta a utilização de
regressão quantílica para uma estrutura de dados em painel apreciado em Canay (2011). Além
disso, utiliza-se de uma base única de registros acadêmicos da Universidade Federal da
Paraíba (UFPB) para a construção de um painel quantílico aluno-turma-período que incluem
estudantes entre 2001 e 2010 na busca de evidências sobre a relação causal do tamanho da
turma na função de produção educacional.
Já o segundo ensaio dedica-se a investigar as relações entre clima e resultado
educacional. Parte-se do pressuposto de que o indivíduo recebe influências genéticas,
ambientais, investimento ao longo da vida e herdabilidade parental que determinam a
formação do seu estoque de capacidades. Logo, embasado pelo modelo teórico de Cunha e
Heckman (2007) para a tecnologia de formação de habilidades, utiliza-se a abordagem
metodológica de Canay (2011) em um painel quantílico aluno-disciplina-ano dos discentes da
UFPB que nasceram no semiárido brasileiro. Em linhas gerais, procura-se inferir sobre a
variável de interesse precipitação nos últimos 12 meses antes do nascimento dos indivíduos
sobre o desempenho acadêmico na faculdade, expresso nas notas das disciplinas cursadas ao
longo dos cursos de graduação, controladas por variáveis socioeconômicas e background
familiar.
Por fim, o terceiro ensaio avalia as implicações de restrições pluviométricas sobre os
períodos iniciais de vida dos indivíduos e seus efeitos nos resultados de saúde expressos na
taxa de mortalidade infantil. A partir de um painel município-a-mês da região semiárida
brasileira, adota-se uma estratégia empírica que envolve três objetivos específicos. Em
primeiro lugar, aplica-se a metodologia baseada em Canay (2011) para captar a
heterogeneidade não observada e os efeitos das covariáveis em ambientes de efeito fixo.
Segundo, visando endogeneizar a quantidade de chuvas, utiliza-se a Temperatura da
Superfície do Mar (TSM) como instrumento em um modelo empírico baseado em Harding e
Larmarche (2009). E em terceiro lugar, verifica-se a confiabilidade dos dados de reanálise a
partir de dados observacionais para precipitação.
A estrutura da tese é dividida além desta introdução, em três capítulos dedicados a
apresentar em cada um os referidos ensaios aqui expostos. Ao final apresentam-se as
considerações finais do estudo.
15
CAPÍTULO 1: O Impacto do Tamanho da Classe no Desempenho Acadêmico
Superior: Efeitos Condicionais Heterogêneos
Resumo
O presente ensaio avalia o impacto causal do tamanho da classe no desempenho acadêmico
dos alunos universitários. Para isso, utiliza-se uma base de dados única de registros
administrativos no período de 2001 a 2010, sobre o desempenho acadêmico dos discentes da
Universidade Federal da Paraíba (UFPB), bem como informações sobre as características
individuais, background familiar e a nota de entrada do vestibular. Além disso, aplica-se o
método de regressão quantílica em estruturas de dados em painel abordado em Canay (2011)
para um painel aluno-turma-período. No que concerne os resultados obtidos, observou-se que
as estimações são estatisticamente significativas ao longo da distribuição, com efeitos
negativos para cauda inferior e efeito positivo para a cauda superior. Além disso, as análises
indicam que estudantes adicionais do sexo feminino ou aqueles com melhores resultados nos
testes de entrada tendem a melhorar o desempenho da turma em geral, e, por outro lado, mais
aluno com renda alta tem efeito negativo, sobretudo na cauda inferior.
Palavras-chaves: Tamanho da Turma; Regressão Quantílica com efeitos fixos; Desempenho
acadêmico; Políticas de Redução de turmas.
Abstract
This paper evaluates the impacts of class size on academic performance of college students.
For this, it uses a single database of administrative records in the 2001-2010 period, about the
academic performance of students of the Federal University of Paraíba (UFPB) as well as
information on individual characteristics, family background and note Vestibular input.
Moreover, it applies the quantile regression method discussed panel data structures in Canay
(2011) for a student-class time-panel. Concerning the results obtained, it was observed that
the estimates are statistically significant throughout the distribution, with negative effects on
the bottom tail and a positive effect on the upper tail. Furthermore, analyzes indicate that
additional female students or those with better results at the entry tests tend to improve the
performance of the class in general and, on the other hand, more student with high income has
a negative effect, especially in the lower tail .
Keywords: Class Size; Quantile regression with fixed effects; Academic performance;
Reduction Policies classes.
16
1.1 INTRODUÇÃO
Em toda a literatura que aborda questões referentes à educação, ainda não há consenso
de quais/como são os principais inputs determinantes da função de produção educacional1 e
seus efeitos. Um dos exemplos claros de controvérsia é o efeito do tamanho das turmas. Para
o ensino básico2, alguns estudos estimam que o tamanho da turma possui impactos negativos
(Angrist e Lavy, 1999; Krueger, 1999; Urquiola, 2006), misto (Duflo et. al., 2000; Alam,
2000) ou até mesmo nenhum impacto sobre os resultados educacionais (Hoxby, 2000;
Asadullah, 2005; Banerjee et. al., 2005). Esses resultados contrastantes podem estar
relacionados a graves problemas econométricos que refletem na dificuldade de mensurar os
verdadeiros efeitos causais dessa relação.
Quanto ao ensino universitário, apesar de uma literatura incipiente, as poucas
evidências já são perceptíveis de que também não existe um consenso. Por exemplo, Machado
e Vera-Hernandez (2008), a partir dos dados administrativos da Universidade Carlos III de
Madri na Espanha, não encontraram qualquer efeito significativo do tamanho da classe no
desempenho dos alunos. De Giorgi, et. al., (2012), avaliando a Universidade de Bocconi na
Itália, descobrem que o tamanho das turmas tem um impacto pequeno, mas negativo e
significativo. Efeitos negativos também são encontrados em Bedard e Kuhn (2006) e Monks e
Schmidt (2011), para a Universidade da Califórnia nos EUA e uma Universidade Privada da
costa leste dos EUA, respectivamente. Já Bandiera, Larcinese e Rasul (2010), investigaram
Universidade líder do Reino Unido e concluíram que existe um efeito negativo na média,
contudo, para determinados tamanhos de classes tem pouco efeito sobre os resultados dos
testes. Mais recentemente, De Paola, Ponzo e Scoppa (2013), usando dados da Universidade
da Calábria, no interior da Itália, constataram que classes maiores determinam um efeito
negativo e significativo sobre o desempenho dos alunos, mas ao considerar uma dummy para
classes grandes e pequenas, remataram que esse efeito negativo é significativamente maior
para estudantes de baixa capacidade.
Regra geral, as estimativas costumam introduzir variáveis relacionadas aos indivíduos
como o background familiar e outras características individuais, dados sobre professores,
insumos escolares, entre outros, embora variem na configuração de diferentes estratégias de
identificação, metodologia adotada e contexto institucional. Uma característica comum à
maioria dos estudos sobre o efeito do tamanho da classe, sobretudo no ensino superior, é o
foco na média da distribuição de desempenho acadêmico. Neste contexto, Harding e
Lamarche (2014) adotam um estimador de regressão quantílica em dados em painel para
variáveis endógenas, e avançam na literatura ao concluir que existe heterogeneidade de efeitos
ao longo da distribuição condicional do desempenho acadêmico dos alunos. Os autores
ressaltam que esses resultados são consistentes com as atuais pesquisas na área de psicologia
educacional e relevante para os decisores de políticas públicas.
1
A Função de Produção de Educação, denominada de FPE, analisa a forma como os diversos insumos do
processo educacional podem afetar os resultados educacionais dos indivíduos (Hanushek, 1970, 1979).
2
Chamadas de escolas primárias e secundárias na literatura internacional, que correspondem ao ensino
fundamental e médio no Brasil.
17
Comparado a literatura internacional, a investigação sobre os efeitos do tamanho da
classe do ensino básico no Brasil é muito mais limitada e consequentemente controversa, por
exemplo, temos Menezes-Filho (2007), Oliveira e Menezes-Filho (2008), Camargo e Sabino
Porto Júnior (2014)3, dos quais encontraram nenhum efeito, efeito negativo e efeito
relativamente misto, respectivamente. Outrora, até o presente momento não se tem
conhecimento de nenhum outro estudo voltado a analisar o papel do tamanho das turmas de
faculdade no desempenho acadêmico dos alunos universitários do Brasil. Dessa forma, o
presente artigo vem a contribuir com a literatura em cenário onde os cursos universitários do
Brasil são um laboratório sub-explorados no que diz respeito aos efeitos do tamanho da
classe.
A propósito, este artigo analisa os registros administrativos da Universidade Federal
da Paraíba para identificar o impacto causal do tamanho na classe nas notas obtidas nas
disciplinas ao longo dos cursos de graduação da instituição. Seu escopo é: i) mostrar
evidências da importância da turma na explicação do desempenho distributivo; ii) estratificar
a amostra por centro acadêmico a fim de estimar alguns efeitos do tamanho da turma e suas
implicações para as políticas de redução de classe; e, por fim, iii) avaliar os efeitos das
covariáveis estudadas.
Para alcançar esses objetivos, analisa-se a distribuição condicional de desempenho
acadêmico por meio da aplicação do método de regressão quantílica com dados em painel
abordado em Canay (2011). Essa abordagem leva em consideração os indícios da literatura de
que os diferentes quantis respondem de forma distinta a alterações nas variáveis explicativas.
O argumento para isso é a existência de heterogeneidade não observada entre os indivíduos e
efeitos fixos de localização, como por exemplo, a motivação ou habilidade do aluno em
absorver conhecimento e qualidade de ensino. Assim sendo, características não observáveis
correlacionadas com o tamanho da turma e com as covariáveis poderiam ser responsáveis por
uma parcela dos resultados educacionais. Ademais, utilizar-se-á a especificação de De
Giorogi et. al (2012), exceto o uso da variação experimental4, uma vez que não existe na
UFPB.
Além dessa introdução, o trabalho organiza-se em mais quatro seções. A seção 1.2
trata do contexto institucional abordando características da instituição, bem como traça o
perfil do estudante a fim de captar informações associadas as variáveis de controle utilizados
nas estimações. A seção 1.3 discute a estratégia empírica e descreve os dados utilizados aqui.
A seção 1.4 destina-se os resultados sobre o desempenho acadêmico. Finalmente, a seção 1.5
as considerações finais.
3
Os autores investigam o efeito do acréscimo de alunos na sala de aula, não a redução das turmas.
Os autores utilizam dados baseado numa variação experimental que surge a partir de um mecanismo de
atribuição aleatória de alunos para dar aula na Universidade de Bocconi.
4
18
1.2 CONTEXTO INSTITUCIONAL E PERFIL DO ALUNO
A análise aqui requerida é baseada nos dados administrativos sobre cada aluno da
Universidade Federal da Paraíba (UFPB), para os anos de 2001 à 2010. A UFPB5 é a maior
Instituição Pública de ensino superior existente no Estado. No total possui 72 cursos de
graduação distribuídos em 13 (treze) Centros acadêmicos6 que compõem quatro Campi7
Universitários. O Campus I8, localizada na cidade de João Pessoa, é o maior campi e possui
maior quantidade de matriculados, e, portanto, foco da análise desse estudo.
O ingresso de estudantes pode ocorrer de duas formas tradicionais: i) Vestibular no
qual testa os conhecimentos do estudante nas disciplinas cursadas no ensino médio; ii)
Exame Nacional de Ensino Médio (ENEM) que também tem questões relacionadas ao
aprendizado do ensino médio e que somente passou a ser forma de ingresso obrigatória após
2010, e, com isso, não pertence a nossa análise. Além das formas tradicionais, ainda tem-se
convênios, mudanças de campus, alunos graduados, transferência, reopção de curso,
reingresso, entre outros.
O sistema de ensino comporta três fases: uma graduação, que pode ser licenciatura ou
bacharelado, com duração média de 4 (quatro) à 5 (cinco) anos; um mestrado de duração de 2
(dois) anos e um doutorado em média 4 (quatro) anos. Contudo, para fins desta análise
concentrar-se-á apenas em estudantes dos cursos de graduação que foram matriculados em
disciplinas de 2001 à 2010, dos quais foram ofertados 5.047 disciplinas distintas. Para cada
curso existe um departamento específico que coordena as atividades de ensino e extensão,
bem como a sua logística.
Cada programa de graduação possui um currículo acadêmico com sua própria lista de
disciplinas básicas (obrigatórias) ou oferecendo uma escolha de disciplinas eletivas, além do
que estas podem incluir disciplinas pertencentes a outros departamentos acadêmicos. O
período letivo é semestral, no qual o aluno se matricula nas disciplinas que pretendem cursar.
Ao final de cada semestre, cada estudante deve obter uma nota igual ou superior a 7 para ser
aprovado por média ou maior ou igual a 5 após os exames finais. Ao final do curso o aluno
obtém o Coeficiente de Rendimento Escolar que nada mais é do que o somatório ponderado
de todas as disciplinas cursadas ao longo do tempo e adicionado ao trabalho de conclusão de
curso confere ao aluno o referido diploma de graduação.
Normalmente, o aluno que ingressa na Instituição automaticamente já é matriculado
nas disciplinas que compõem o primeiro semestre da grade curricular pré-definida. No
5
Além da UFPB, tem-se a Universidade Estadual da Paraíba (UEPB); Instituto Federal da Paraíba (IFPB) e a
Universidade Federal de Campina Grande (UFCG).
6
A lista dos cursos de graduação e seus respectivos Centros Acadêmicos encontram-se no Anexo I.
7
A estrutura da UFPB comporta: i) Campus I (na cidade de João Pessoa); ii) Campus II (Areia); iii) Campus III
(Bananeiras); iv) Campus IV (Mamanguape e Rio Tinto).
8
Fazem parte os seguintes Centros: Centro de Ciências Humanas, Letras e Artes - CCHLA; Centro de Educação
– CE; Centro de Comunicação, Turismo e Artes - CCTA, Centro de Ciências da Saúde - CCS; Centro de
Tecnologia - CT e Centro de Ciências Jurídicas - CCJ; Centro de Ciências Exatas e da Natureza – CCEN; Centro
de Biotecnologia - CBiotec; Centro de Tecnologia e Desenvolvimento Regional - CTDR; Centro de Ciências
Sociais Aplicadas - CCSA ;Centro de Ciências Médicas - CCM; ; Centro de Informática - CI e Centro de
Energias Alternativas Renováveis – CEAR
19
entanto, este aluno tem a opção de trancamentos, mesmo no primeiro semestre. Sem
trancamentos, para cada semestre teríamos turmas de tamanhos iguais, que no universo
grande, a probabilidade disso ocorrer é pequena. Além disso, com as mais diversas formas de
ingresso nos cursos, bem como a existência de alunos que repetem, abandonam, transferem,
fazem com que o tamanho da turma varie ao longo do tempo. Desta variação pressupõe-se
que são correlacionados com o interesse e capacidade do aluno e aqui permite ser palco de
debate político e acadêmico a respeito do seu impacto no desempenho educacional dos
alunos.
No intuído de caracterizar a demanda estudantil da UFPB constatou-se que nos
últimos anos a instituição vem implantando um conjunto de políticas de expansão que
conferiram o aumento de matrículas. Para ilustrar, de 2005 para 2011 a instituição elevou o
número de cursos de graduação de 50 para 104, bem como o número de alunos matriculados
que passou de 18.759 para 29.629 estudantes (NTI, 2012), seja pelo aumento da oferta ou da
demanda propriamente dita. Sabe-se que o aumento de matrículas importa em ajustes de
inputs, como por exemplo, a contratação de novos professores, expansão de espaço físico,
contratação de novos funcionários administrativos, entre outros, que muitas vezes necessitam
de um tempo maior para sua implantação. Esse lapso temporal entre os ajustes pode trazer a
tona questões como aumento do tamanho da classe para comportar essa nova demanda.
Além disso, as salas de aulas possuem capacidades físicas limitantes que
comprometem o número de matriculado por disciplina. Hoje, há cerca de 70 departamentos
gerenciando os mais diversos tamanhos de sala de aula. Não obstante, o aluno também se
depara com problemas de cunho pessoal ou profissional que compromete a duração do curso,
fato comprovado pelo número de egresso (após o período mínimo de curso) que difere
quantitativamente do egresso9. Tais fatos evidenciam que o aluno se depara normalmente com
turmas maiores ou menores ao longo do curso.
Neste cenário, investiga-se o impacto do tamanho da classe no desempenho acadêmico
dos alunos que ingressaram nos cursos de graduação da UFPB, e este é possibilitado por
algumas razões. Primeiro, a existência de uma gama de informações obtidas junto ao Núcleo
de Tecnologia da Informação (NTI) dos quais se extraem informações concernentes ao
desempenho acadêmico e características individuais dos alunos. Segundo, uma vez que de
certa forma o aluno tem a opção de escolher a disciplina e o período em que irá cursá-la, há
aleatoriedade na formação e composição das turmas. Terceiro, o uso das notas das disciplinas
parecer ser uma proxy mais confiável para resultado educacional individual do que os testes
padronizados comumente utilizados na literatura. A Tabela 1.1 traça o perfil do aluno aqui
estudado.
A fim de capturar informações a respeito dos discentes do período de 2001 à 2010, a
Tabela 1.1 sumariza as principais informações abrangendo características individuais.
Verifica-se que cerca de 51% são mulheres; 55% são da cor branca e na grande maioria
possui renda familiar baixa de até 3 salários mínimos. Em termos de escolaridade do pai,
observa-se elevada taxa de pai sem instrução (24,57%) que somado aos pais de ensino
9
Ver Apêndice A1.
20
fundamental (14,34%) totaliza quase 40% da amostra, denotando um baixo background
familiar. Apesar disso, boa parte da amostra vem de escola privada tanto no ensino
fundamental (57,54%) quanto no ensino médio (56,28%), possuem computador em casa
(71,28%) e no momento do ingresso na Instituição não exercia trabalho remunerado
(74,44%).
Tabela 1.1 – Perfil do aluno da UFPB de 2001 à 2010
Sexo
Feminino
51.30%
(532.55)
Raça
Masculino
48.70%
(544.69)
Brancos
55.90%
(545.02)
Não Brancos
44.10%
(527.79)
Renda Familiar
Mínima
6.47%
(493.89)
Analfabeto
24.57%
(504.64)
Baixa
46.56%
(510.19)
Fundamental
14.34%
(513.82)
Mãe trabalha?
Média
33.07%
(547.81)
Instrução do Pai
Médio
33.26%
(531.82)
Alta
13.90%
(579.80)
Superior ou mais
27.83%
(563.26)
Pai Trabalha?
Sim
Não
80.30%
19.70%
(535.76)
(517.95)
Tipo de Escola do Ensino Fundamental
Sim
Não
73.60%
26.40%
(539.74)
(517.01)
Tipo de Escola do Ensino Médio
Pública
Privada
42.46%
57.54%
(504.66)
(551.01)
Aluno exerce algum trabalho
Pública
43.72%
(504.78)
Privada
56.28%
(552.14)
Tem computador em casa
Sim
25.56%
(517.95)
Sim
71.28%
(542.11)
Não
28.72%
(504.23)
Não
74.44%
(535.91)
Fonte: Elaboração Própria a partir dos dados fornecidos pelo NTI (UFPB). Os valores em % representam a
participação percentual do total da amostra com informações disponíveis. Os Valores entre parênteses
correspondem a média obtida no vestibular pelo grupo de indivíduos.
Outro ponto a ser destacado são os resultados dos testes de pré-inscrição. Ao calcular
uma média para cada grupo – valores entre parênteses na Tabela 1.1 – confirmam-se alguns
preceitos da literatura. Por exemplo, alunos de renda familiar baixa possuem nota média de
entrada menor do que aqueles com renda mais alta. O mesmo ocorre para aqueles que têm
pais analfabetos ou mesmo aqueles em que pai ou mãe que não trabalham. Destarte,
estudantes do sexo masculino, brancos, com renda familiar alta, filhos de pais que trabalham,
alunos oriundos de escola privada, tem computador em casa e não exerciam trabalho
remunerado na época do teste de entrada tem um melhor desempenho.
No que tange o perfil dos docentes, a Tabela 1.2 apresenta os alguns números por
centro acadêmico e titulação. Verifica-se que durante o período analisado (2001-2010),
grande parte do corpo docente tem titulação de doutorado, o que significa cerca de 40% do
21
total. Note que boa parte dos doutores concentram-se nos centros CT e CCS, dos quais os
cursos de engenharia, odontologia, nutrição, entre outros, se encontram.
Tabela 1.2 – Número de docentes por Centro Acadêmico e por Titulação
Centro
Acadêmico/Titul
ação do Docente
CCEN
CCHLA
CCM
CE
CCSA
CT
CCS
CCJ
CCTA
CEAR
CI
Total por
Titulação
Especialização
Graduação
Mestrado
Doutorado
Pósdoutorado
Total por Centro
Acadêmico
7
10
39
4
18
13
35
16
13
1
0
49
56
32
16
101
72
132
38
101
1
7
62
91
42
48
106
96
167
29
81
0
8
134
177
42
53
98
196
187
20
64
2
9
0
1
0
0
0
0
0
1
1
0
0
252
335
155
121
323
377
521
104
260
4
24
156
605
730
982
3
2.476
Fonte: Elaboração Própria a partir dos dados do NTI (UFPB).
É possível, ainda, destacar dois pontos. Primeiro, considerando titulação como proxy
para qualidade dos docentes, o que, por sua vez, seria indicativo da qualidade de ensino
ofertada, poderia inferir a priori que a qualidade educacional da instituição é baixa tendo em
vista que cerca de 60% do total da amostra tem no máximo o título de mestre. Segundo,
reforçar-se tal constatação pelo inexpressivo número de pós-doutores no geral e por centro,
como também a existência de docentes com apenas especialização e o elevado número de
professores apenas com graduação.
22
1.3 ESTRATÉGIA EMPÍRICA E DADOS
Neste artigo busca-se estimar o efeito distributivo do tamanho da classe controlando as
características individuais e background familiar dos discentes da Universidade Federal da
Paraíba (UFPB) e características dos docentes. Notadamente, esta seção esclarece a estratégia
adotada para atingir o objetivo proposto, no qual inicialmente, apresentam-se a abordagem
empírica adotada e, posteriormente, expõem-se os dados utilizados na construção do painel
quantílico.
1.3.1 Estratégia empírica
A preocupação central deste ensaio concentra-se na estimação do efeito distributivo do
tamanho da classe no ensino universitário, a especificação do modelo segue a literatura
existente (Machado e Vera-Hernandez, 2008; Bandiera, Larcinese e Rasul, 2010;), em
especial ao adotado em De Giorgi et. al. (2012) e Harding e Larmarche (2014)10:
=
+
+
(1)
onde
é a nota média do aluno i, na classe c, período t;
é o vetor de variáveis
exógenas que inclui o tamanho da turma, proporção de alunos do sexo feminino, proporção de
alunos com renda alta e nota de entrada do aluno i. Por fim, o temo
que corresponde os
fatores não observados associados ao aluno i; e período t. Importante destacar que a equação
(1) é a identificação adequada para o problema de pesquisa, pois se considera a existência da
endogeneidade, mas admitindo-a que ela é controlada no tempo.
De Giorgi et. al (2012) e Harding e Lamarche (2014) consideram as variáveis:
tamanho da turma; % aluno do sexo feminino e % de aluno com renda alta como endógeno.
No entanto, para o caso do sistema público de ensino superior do Brasil, particularmente a
UFPB, as variáveis são exógenas ao modelo, veja:
a) Tamanho da turma – no sistema público de ensino do Brasil, os alunos não escolhem
as disciplinas formando portfólios como nas universidades fora do país. O aluno ao
ingressar na universidade se depara com uma oferta restrita de disciplinas que
compõem seu currículo acadêmico e que normalmente é ofertada uma disciplina por
semestre. Apesar de existir certa flexibilidade, no geral o tamanho da turma é
exógeno.
b) Proporção de alunos com renda alta – ao ingressar na UFPB, alunos ricos ou pobres se
deparam com a mesma oferta de disciplinas. Por exemplo, não existem professores
que montem cursos mais caros, logo, independente da classe social, os mesmo cursos
são ofertados. Destarte, proporção de alunos de renda alta também é exógeno.
c) Proporção de alunos do sexo feminino – é análoga a análise anterior, pois o fato do
discente ser mulher não implica matrículas em disciplinas diferenciadas, logo, também
é exógeno.
10
Harding e Lamarche (2014) consideram um modelo estrutural, uma vez que considera que existe um vetor de
variáveis potencialmente endógenas.
23
Neste arcabouço, a equação (1) é a Função de Produção11 que incorpora a
heterogeneidade não observada, permitindo que variáveis latentes afetem o desempenho
acadêmico e não contabilizá-las poderia causar viés nas estimações. Para atingir o objetivo
proposto por este trabalho, esta seção apresenta o estimador de dois estágios abordado em
Canay (2011).
I - Estimador de Regressão Quantílica com efeitos fixos – QR(FE)
O enfoque dado neste artigo permite que as covariadas afetem tanto a posição quanto a
dispersão e o formato da distribuição dos desempenhos acadêmicos dos alunos. Dessa
maneira, temos o impacto das covariáveis para cada ponto da distribuição. A
operacionalização é dada pelo método de regressão quantílica. Por outro lado, os dados em
painel permite incluir os efeitos fixos para controlar por fatores não observados. O método
abordado em Canay (2011), potencialmente abarca tais especificações e o método aqui
proposto.
Canay (2011) apresenta um estimador consistente em que utiliza uma simples
transformação de dados para eliminar os efeitos fixos dos quantis condicionais, conforme o
modelo:
=
+
+
(
/
,
)=0
(2)
Onde ( , ) ∈ ℝ ℝ são variáveis observáveis, ( ) = e ( , ) ∈ ℝ ℝ são não
observados.
/ ,
≈ [0,1]. A função →
( ) é assumida como sendo estritamente
crescente em ∈ (0,1) e o parâmetro de interesse é assumido para ser ( ). A principal
restrição é que as heterogeneidades individuais associadas a
deve ter um efeito local puro.
Em suma, o método versa na questão em que as condições ( , ) do parâmetro
( ) podem ser identificadas e consistentemente calculadas a partir dos dados. Para estimar a
(. ) ≡
equação (2), Canay (2011) propõe um estimador simples de dois passos, sendo
∑ (. ) e
(. ) ≡ ( ) ∑ ∑ (. ), como segue:
Passo 1. Deixe
como:
Passo 2. Sendo
11
para √
≡
−
( )≡
– estimador consistente de
≡Ε [
−
. Estimam-se os efeitos fixos
(3)
]
e definir o estimar do dois-estágios ( ) como:
∈(.)
[ (
−
)]
(4)
A Função de Produção de Educação clássica, denominada de FPE, analisa a forma como diversos insumos do
processo educacional podem afetar os resultados educacionais dos indivíduos. É dada por
= ( , , , ),
onde Y é um vetor educacional realizado pelo estudante; F é um vetor de características individuais e familiares;
P é um vetor do corpo discente (influência dos pares); I é um vetor de dotações iniciais; e S é um vetor de
insumos escolares relevantes (Hanushek , 1970, 1979, 2007).
24
Grosso modo, a ideia do método consiste em apurar o efeito fixo da variável
dependente através de um estimador de média condicional (OLS), e depois aplicar uma
regressão quantílica em dados em painel substituindo a variável dependente pelo valor
deduzido do efeito individual.
1.3.2 Descrição dos dados
As estimativas da pesquisa foram possibilitadas pelos registros acadêmicos estudantis
compilados pelo Núcleo de Tecnologia da Informação (NTI) e pela Comissão Permanente de
Vestibular (COPERVE). A partir das duas fontes de dados foi possível obter informações do
desempenho dos alunos ao longo do curso, bem como características socioeconômicas dos
ingressantes nos cursos de graduação da Universidade Federal da Paraíba (UFPB), Campus I,
durante o período de 2001 à 2010.
Do NTI foram extraídos variáveis sobre o desempenho acadêmico dos alunos ao longo
do curso expressas pelas notas das disciplinas, bem como informações das respectivas
disciplinas cursadas, o número de matriculados, reprovados, trancados, aprovados e o
coeficiente de rendimento final (CRE)12, entre outros. Além disso, a base ainda possibilita
obter informações sobre os docentes, como carga horária e titulação.
Tabela 1.3 – Estatísticas Descritivas Geral
Variáveis
Nº Obs
Média
Desvio Padrão
Mínimo
Máximo
Desempenho Acadêmico
196.973
6.29
3.43
0
10
Tamanho da Turma
196.973
26.45
15.69
1
95
196.973
48.91
26.48
0
100
196.973
34.10
28.02
0
100
196.973
532.60
61.68
390.2
752
Proporção de alunos do sexo
feminino
Proporção de alunos com
renda alta
Nota de entrada (Vestibular)
Fonte: Elaboração Própria a partir dos dados do NTI (UFPB).
Por sua vez, os dados da COPERVE compreendem o questionário socioeconômico
respondido pelo ingressante no momento do vestibular. Destarte, as informações concernem
características do aluno como sexo, raça, local de nascimento, rede escolar ao qual o aluno
estudou no ensino fundamental e médio, além do background familiar como escolaridade do
pai, nível de ocupação, como também o resultado no teste de inscrição, ou seja, a nota final
12
De acordo com a Resolução UFPB nº 47/1999, o Coeficiente de Rendimento Escolar (CRE) do aluno é obtido
a partir da seguinte fórmula:
=
∑
, onde
é a média final da i-ésima disciplina cursada ou dispensada;
é o número de horas-aula correspondente a i-ésima disciplina cursada ou dispensada; e,
é p número total de
horas-aulas o que equivale ao número de créditos total correspondente às disciplinas cursadas ou dispensadas
excluindo as disciplinas trancadas.
25
obtida no vestibular. As Tabelas 1.3 e 1.4 reportam-se a algumas estatísticas descritivas sobre
as variáveis selecionadas da amostra:
A Tabela 1.3 apresenta a média, desvio padrão, valor mínimo e valor máximo das
variáveis selecionadas neste estudo de um modo geral considerando um painel alunodisciplina-período. No total são 196.973 observações referentes a 6.167 alunos com suas
respectivas notas em 47.375 disciplinas ofertadas ao longo do tempo. A nota média dos
alunos é em torno de 6,30 representativas de perfil discente no qual em média maior
proporção de alunos são do sexo feminino, cerca de 49%, e apenas 34%, em média, possuem
renda alta. Além disso, é possível notar que o tamanho médio das turmas é aproximadamente
26 alunos por classe. No entanto, se dividirmos os dados por centro acadêmico, observa-se
que as médias das variáveis selecionadas divergem, denotando diferentes perfis de aluno para
cada área de curso, conforme a Tabela 1.4.
Tabela 1.4 – Estatística Descritiva por Centro Acadêmico – Média
Variáveis/Centros
Acadêmicos
CCEN
CI
CT
CCSA
CCHLA
CCTA
CE
CCS
CCJ
CCM
Desempenho Acadêmico
4.91
5.49
5.53
5.91
6.62
7.06
7.39
7.47
8.29
8.48
Tamanho da classe
34.96
35.65
36.18
42.22
38.56
28.66
38.31
33.01
38.84
35.93
Proporção do sexo
feminino
34.72
15.35
34.5
43.02
64.05
54.01
88
64.08
43.03
43.85
Proporção de alunos com
renda alta
23.21
60.52
43.41
33.57
26.31
34.38
7.96
27.8
78.87
70.48
Nota de entrada
506.81
608.45
549.2
513.48
509.93
519.97
463.78
555.25
647.53
697.9
Nº Observações
29665
3474
28736
34460
24802
14188
10764
31463
3918
4953
Fonte: Elaboração Própria a partir dos dados do NTI (UFPB).
Da Tabela 1.4 é possível apontar algumas peculiaridades dos cursos oferecidos pela
instituição. Notem que os centros CCM e CJ, dos quais ofertam os cursos de medicina e
direito, respectivamente, tem maior nota média de entrada como também maiores
desempenhos acadêmicos médios, além do que a maior proporção de alunos com renda alta.
Com relação a proporção de alunos do sexo feminino, o maior percentual médio encontra-se
no Centro de Educação corroborados pelos cursos de pedagogia. No que tange o tamanho
médio das turmas, averígua-se uma uniformidade na média, pois são cerca de 30 a 40 alunos
por turma.
Outro fato interessante corresponde ao Centro de Tecnologia, onde estão os cursos de
engenharia, note que apesar da nota média de inscrição ser alta, esta não é acompanhado pelo
desempenho acadêmico dos alunos. Veja que a nota média é de 5,53, uma das mais baixas,
perdendo apenas para a nota média do CCEN (onde ficam cursos como física, química, etc.)
do CI (ciências da computação, matemática computacional). Parece que a entrada para esses
26
centros é difícil dada a nota média do vestibular ser alta, mas manter este desempenho ao
longo do curso parece ser ainda mais difícil.
É imperioso destacar que o olhar breve por essas estatísticas descritivas não é possível
identificar se há uma relação negativa entre o tamanho da turma e as notas das disciplinas.
Isto se deve ao um conjunto de fatores associados aos indivíduos, ou docentes, ou a
instituição ou mesmo ao tempo que podem influenciar positivamente ou negativamente nesta
relação. Desta feita, na próxima seção aplica-se a metodologia adequada para obter
estimativas confiáveis desta relação.
27
1.4 RESULTADOS E DISCUSSÃO
Nesta seção analisa-se o efeito do tamanho da classe no desempenho acadêmico. Para
isso estima-se a equação (1) pelo método abordado por Canay (2011) no qual se considera a
heterogeneidade não observada e os efeitos fixos. Posteriormente, restringe-se a amostra para
aqueles indivíduos pertencentes aos centros acadêmicos a fim de captar peculiares efeitos no
desempenho dos discentes. Finalmente, investiga-se a interação das covariáveis para testar seu
impacto no desempenho acadêmico.
1.4.1 Linha base
Com o objetivo de investigar como o tamanho da turma influencia a performance dos
alunos nas disciplinas cursadas, realizam-se regressões em um painel aluno-disciplinaperíodo que incluem estudantes entre o período de 2001 à 2010, utilizando variações de
controles para discentes e para docentes. Os controles individuais correspondem a
características dos indivíduos tais como: i) sexo, ii) cor, iii) se havia exercido trabalho
remunerado no momento da inscrição do vestibular, iv) se possuía computador em casa, v)
rede escolar do ensino fundamental; e vi) rede escolar do ensino médio. Além disso, variáveis
relacionadas ao background familiar como: vii) escolaridade do pai13, viii) se os pais
trabalham, e ix) renda familiar. Quanto ao controle dos professores tem-se e a carga horária
trabalhada no período.
Os resultados reportados na Tabela 1.5 correspondem a diferentes estimadores e
especificações do modelo. Para fins de comparação, utilizou-se a mediana ( = 0.5) para obter
as estimativas das colunas 1 à 3 que correspondem ao estimador padrão de regressão
quantílica (QR) e, nas colunas 4 à 6 ao estimador robusto de Canay (2011) – Regressão
Quantílica para estrutura de dados em painel. A variação entre as colunas para cada estimador
correspondem ao uso de controles individuais e de professores. Em síntese, observam-se as
estimativas foram estatisticamente significativas a pelo menos 1%, revelando a priori uma
relação negativa entre o tamanho da classe e o resultado educacional dos indivíduos (Bandiera
et. al., 2010; Machado Pinto e Vera Hernandez, 2010; De Giorgi, et. al, 2012).
Além disso, deduz-se que mudanças na proporção de mulheres afetam positivamente a
variável resposta, ou seja, estudantes do sexo feminino tendem a melhorar o desempenho
mediano da turma (Monks e Schimidt, 2010; Harding e Lamarche, 2015). No entanto, o
mesmo não ocorre para a proporção de indivíduos com renda alta, note que os parâmetros
foram estatisticamente insignificantes e parece que ter mais alunos com renda alta não afeta o
desempenho acadêmico mediano (Harding e Lamarche, 2014). No que diz respeito a variável
nota de entrada, ou seja, nota no exame de vestibular, verifica-se que há um efeito
estatisticamente significante e positivo, do qual alunos com testes de entrada mais altos
tendem a melhorar o desempenho dos estudantes na mediana (Harding e Lamarche, 2014).
13
Optou-se pela escolaridade do pai, pois a base não continha informações sobre a escolaridade da mãe.
28
Tabela 1.5 – Resultados Empíricos para a mediana
QR
(1)
(2)
= 0.5
(3)
QR(FE)
(4)
(5)
(6)
Efeitos de Interesse
Tamanho da Classe
Proporção do sexo feminino
Proporção de renda alta
Nota de entrada
-0.0073***
-0.00847***
-0.0087***
-0.0050***
-0.0062***
-0.0056***
(0.0005)
(0.00046)
(0.0005)
(0.0004)
(0.0003)
(0.0004)
0.0195***
0.02306***
0.0195***
0.0251***
0.0313***
0.0038***
(0.0004)
(0.00030)
(0.0004)
(0.0003)
(0.0002)
(0.0258)
-0.0001
-0.00077*
-0.0005
0.0002
-0.0005*
-0.0004
(0.0004)
(0.00032)
(0.0004)
(0.0003)
(0.0002)
(0.0003)
0.0069***
0.00616***
0.0068***
0.0119***
0.0112***
0.0121***
(0.0002)
(0.00014)
(0.0002)
(0.0001)
(0.0001)
(0.0001)
Controles
Características individuais
sim
não
sim
sim
não
sim
Características professores
não
sim
sim
não
sim
sim
Observações
145.692
138.185
100.976
145.692
138.185
100.976
Fonte: Elaboração Própria a partir dos dados do NTI (UFPB).
Nota 1: Erros padrão robustos entre parênteses. ***p-valor < 0,01. ** p-valor < 0,05. * p-valor < 0,10.
Nota 2: As características individuais são: i) sexo; ii) raça; iii) renda familiar; iv) escolaridade do pai; v) trabalho
remunerado do pai e da mãe; vi) dummy se o aluno estudou em escola pública no ensino fundamental; vii)
dummy se o aluno estudou em escola pública no ensino médio; viii) dummy se o aluno exercia algum trabalho
remunerado no época do vestibular; ix) dummy se o aluno tinha computador em casa. As características dos
professores são: i) titulação; ii) carga horária.
Em termos de magnitude, a coluna (3) revela que um aluno adicional na classe reduz o
grau médio dos estudantes em cerca de 0,009. No entanto, para a estimativa RQ(FE) – coluna
(6) é um pouco menor esta magnitude, cerca de -0,006. Apesar da diferença pequena é
importante frisar o método QR não consegue captar características fixas não observáveis que
determinam o desempenho acadêmico dos indivíduos. Harding e Lamarche (2015) chama
atenção para a heterogeneidade latente existente no modelo aqui estimado, como por
exemplo, a motivação e capacidade do aluno em absorver conhecimento em sala de aula.
É interessante notar que a partir das inferências apresentadas na Tabela 1.5, poder-seia concluir que políticas de redução de número de alunos por turma teria um efeito benéfico
no desempenho acadêmico dos alunos da UFPB. Porém, se avançarmos um pouco mais na
análise, indo além das estimativas condicionais a mediana com o intuito de analisar os
resultados ao longo de toda a função densidade, verifica-se que isso não é verdade para todos
da distribuição. O Gráfico 1.1 apresenta a evolução dos coeficientes da variável de interesse
com um intervalo de confiança de 1% para todos os quantis, comparando a estimativa para
regressão quantílica padrão.
29
Gráfico 1.1 – Estimativas do impacto do tamanho da classe no desempenho
acadêmico dos indivíduos ao longo da distribuição
0,0150
0,0100
0,0050
0,0000
-0,0050
0,2
0,25
0,3
0,4
0,5
0,6
0,7
0,75
0,9
0,95
-0,0100
-0,0150
-0,0200
-0,0250
-0,0300
RQ
RQ(FE)
Fonte: Elaboração Própria a partir dos dados do NTI (UFPB).
Nota: Todas as estimativas foram estatisticamente significativas a 1%.
A linha pontilhada corresponde aos parâmetros do estimador de regressão quantílica
padrão, enquanto que a linha contínua corresponde ao estimador de Canay (2011) utilizando
como proxy14 para desempenho as notas das disciplinas cursadas. Note que com um intervalo
de confiança de 99% associado, os parâmetros de estimador RQ tem: i) tamanho do efeito
maior, em valor absoluto, nos quantis mais baixos, e ii) negativo em cada quantil ( ). Neste
contexto, dois pontos merecem nota. Primeiro, quando aplica-se o estimador de Canay (2011)
averigua-se que existe um quórum demasiado nos baixos quantis e isso se deve a omissão de
efeitos fixos não observados que geram viés nas estimações.
Segundo, complementa a implicação do primeiro ponto. Sabe-se que o viés impede
medir o correto impacto de políticas de redução de turmas. Contabilizadas a heterogeneidade
não observada e os efeitos fixos, o estimador RQ(FE) avalia que redução do tamanho da
turma teria um efeito positivo apenas para os baixos quantis, enquanto que este tipo de
política prejudicaria alunos pertencentes aos quantis mais altos de performance.
Harding e Lamarche (2014) lançam luz com algumas explicações plausíveis sobre
heterogeneidade desses efeitos, pois argumentam que classes menores prejudicariam alunos
que tem boas notas nas disciplinas, uma vez que estes conseguem aprender mais com seus
pares. Como contrapartida, classes menores poderiam favorecer aqueles alunos de baixo
desempenho porque estes poderiam se beneficiar de maiores interações com seus professores,
portanto, ajudando-os a melhorar o desempenho. Logo, os efeitos distributivos do
desempenho dos alunos da UFPB variam de acordo com o tamanho da classe, e medir seu
correto impacto é essencial para as políticas públicas.
14
Os efeitos do tamanho da turma também foram testadas para CRE final como uma proxy alternativa de
desempenho acadêmico, conforme apresentado no Apêndice B. Avaliando sob esta nova métrica, observa-se os
mesmo resultados, concluindo que o método é consistente independente da proxy.
30
1.4.2 Política de Redução do Tamanho da turma por Centro Acadêmico
Utilizando a metodologia do Canay (2011), o mesmo exercício fora realizado para
centros acadêmicos. Para averiguar o efeito do tamanho da turma selecionou-se o Centro de
Ciência de Saúde (CCS), Centro de Ciência Exatas e da Natureza (CCEN) e Centro de
Comunicação, Turismo e Artes (CCTA), dos quais apresentaram o melhor e o prior
desempenho médio, e aquele com menor tamanho de turma, respectivamente, apresentados no
Gráfico 2.
O gráfico 1.2 revela algumas evidências peculiares. Primeiro, apreende-se que o efeito
heterogêneo ao longo da distribuição do tamanho da turma não é consensual entre os centros
acadêmicos, notem que o CCTA (linha pontilhada do gráfico) apresenta estimativas
estatisticamente significativas e positivas ao longo de todos os quantis. Há duas explicações
plausíveis para este indício. Partindo do pressuposto de que alunos de alto desempenho
tendem a se beneficiar com turmas maiores (Harding e Larmarche, 2014), é importante
observar que o CCTA apresentou um os maiores desempenhos médios da amostra (conforme
Tabela 4).
Gráfico 1.2 – Estimativas ao logo da distribuição por centro acadêmico – CCEN, CCTA
e CCS
0,0300
0,0250
0,0200
0,0150
0,0100
0,0050
0,0000
-0,0050
0,2
0,25
0,3
0,4
0,5
0,6
0,7
0,75
0,9
0,95
-0,0100
-0,0150
-0,0200
CCEN
CCTA
CCS
Fonte: Elaboração Própria a partir dos dados do NTI (UFPB).
Nota: Todas as estimativas foram estatisticamente significativas a pelo menos 1%.
Além disso, sabe-se que esse benefício é devido às habilidades que os indivíduos
possuem de aprenderem com seus pares. Sabe-se que a composição de pares é um importante
determinante do comportamento individual e, consequentemente, do desempenho dos alunos
(De Giorgi et. al., 2009), além da concorrência atuando como um forte dispositivo emocional
(Harding e Lamarche, 2014). Ora, as interações entre pares são fundamentais para cursos
como artes cênicas, música, jornalismo, turismo, cinema, entre outros, cursos estes
pertencentes ao CCTA, então seria razoável pensar que quanto maiores as turmas, mais
interações entre pares, reforçados por melhores desempenhos médios, trariam benefícios para
31
qualquer quantil da distribuição. Logo, política de redução de turma tenderia a prejudicar o
desempenho dos estudantes deste centro.
Segundo ponto diz respeito às estimativas referentes ao CCEN e CCS. Conforme já
apresentado na Tabela 1.4 deste artigo, o CCEN é o centro com menor desempenho médio e o
CCS o maior. Temos dois casos distintos e mesmo resultado qualitativo, que seja, políticas de
redução de turma tenderia a melhorar o desempenho dos alunos mais fracos e prejudicar
alunos mais fortes. Para os dois centros há heterogeneidade de efeitos.
No Gráfico 1.3, selecionaram-se dois centros da área de humanas: CCHLA e CCSA,
do qual o curso de Ciências Econômicas faz parte deste último. Análogo as análises
anteriores, reforça-se que o impacto do tamanho da classe diminui negativamente no medida
que cresce o desempenho acadêmico dos alunos. Em outras palavras, é possível perceber que
o efeito é negativo nos baixos quantis, com tendência a diminuir na medida em que
avançamos nos quantis. Outrossim, a eficácia de uma política de redução teria diferentes
impactos para os dois centros, já que para o CCSA o tamanho da turma tem efeito positivo em
percentis mais baixo (a partir do quantil 70) do que o CCHA (a partir do quantil 90).
Gráfico 1.3 – Estimativas ao logo da distribuição por centro acadêmico – CCSA, CCHLA
0,0300
0,0250
0,0200
0,0150
0,0100
0,0050
0,0000
-0,0050
0,2
0,3
0,4
0,5
0,6
0,7
0,75
0,95
-0,0100
-0,0150
-0,0200
CCSA
CCHLA
Fonte: Elaboração Própria a partir dos resultados das estimações.
Nota: Para representar a significância dos parâmetros utilizou-se o marcador fechado e aberto. Marcador
fechado correspondem as estimativas estatisticamente significativas pelo menos 1%, já o marcador aberto são
parâmetros insignificantes estatisticamente.
É importante frisar que a constatação de efeitos heterogêneos é demasiadamente
importante para os chefes de departamento, uma vez que existe um trade-off entre bons e
maus alunos no objetivo de melhorar o desempenho médio do curso. A literatura precedente a
Harding e Lamarche (2014) afirma que uma política de redução de turmas seria benéfica para
todos da distribuição, e aqui se observa que não é bem assim. Aplicar uma política de redução
de turmas pode comprometer resultados como um todo e particularmente danoso para
determinados perfis de turmas.
32
1.4.2 Efeitos das Covariáveis
Além da variável de interesse tamanho da turma, é possível investigar alguns
resultados quantílicos das covariáveis: proporção de alunos do sexo feminino; proporção de
alunos com renda familiar alta e nota de entrada e carga horária. Os resultados obtidos são
sumarizados no Gráfico 1.4.
Gráfico 1.4 – Efeitos quantílicos das covariáveis sobre o desempenho acadêmico.
0,0000
0,0400
-0,0002
0,0350
0,2
0,4
0,6
0,8
1
0,8
1
-0,0004
0,0300
-0,0006
0,0250
% Renda Alta
% Sexo Feminino
0
0,0200
0,0150
-0,0010
-0,0012
-0,0014
0,0100
-0,0016
0,0050
0,0000
-0,0008
-0,0018
0
0,2
0,4
0,6
0,8
-0,0020
1
Quantis
Quantis
(a)
(b)
0,0000
0,0180
0,0160
0
0,2
0,4
0,6
-0,0010
-0,0020
0,0120
Carga Horária
Nota de Entrada
0,0140
0,0100
0,0080
0,0060
0,0040
-0,0030
-0,0040
-0,0050
0,0020
0,0000
0
0,2
0,4
0,6
0,8
1
-0,0060
Quantis
Quantis
(c)
Fonte: Elaboração Própria a partir das estimativas.
Nota: Todas as estimativas foram estatisticamente significativas.
(d)
Em cada gráfico, os pontos pretos ilustram o valor do coeficiente da covariável
correspondente para cada quantil da distribuição de desempenho educacional. A linha
contínua em torno dos pontos representa a tendência dos efeitos associados a cada covariável.
Para facilitar a visualização e interpretação, a linha horizontal contínua em negrito divide os
gráficos no ponto zero. O gráfico (a) corresponde aos resultados para a proporção do sexo
feminino na sala de aula. Observa-se um efeito positivo para todos os quantis, que
qualitativamente é análogo ao apresentado para a mediana na Tabela 5 e corrobora com os
resultados de Monks e Schimidt (2010). No entanto, à medida que o desempenho aumenta
menor é o efeito de mulheres adicionais na turma conforme apontado em Harding e Lamarche
(2015).
33
O gráfico (b) mostra os resultados para a proporção de alunos com renda alta. Na
Tabela 5, ao observar apenas os valores da mediana, concluiu-se a priori que adicionar alunos
de renda alta nas turmas não afetaria o desempenho acadêmico. Todavia, este resultado não é
ratificado ao longo da distribuição condicional. Observa-se que num intervalo de confiança de
90% associado, adição de alunos com renda alta tem efeito negativo ao longo da distribuição,
sobretudo na cauda inferior. Por sua vez, o gráfico (c) traz as estimativas da nota de entrada
dos indivíduos, ou seja, as notas nos exames do vestibular. Há um efeito estatisticamente
significativo, positivo e decrescente ao longo da dos quantis, reforçando que estudantes que
estavam com maiores notas no exame de entrada tem efeito sobre aqueles pertencentes aos
baixos quantis.
Por fim, o gráfico (d) corresponde a variável de controle utilizada para captar as
características de professores. Utilizou-se a carga horária exercida por semestre.
Estatisticamente significativos, os resultados sugerem que a carga horária tem efeito negativo
sobre o desempenho acadêmico dos indivíduos independente de sua posição na distribuição
condicional. Veja-se que este efeito é ainda mais intenso na calda inferior. Em consonância
com a análise do tamanho da turma, do qual parte-se do pressuposto que classes menores
beneficiariam alunos mais fracos, isto porque teriam uma atenção adicional do professor
(Haridng e Lamarche, 2014). Logo, quanto maior a carga horária do docente, menos tempo
ele tem para se dedicar a produção de material e disponibilidade de atendimento a esses
alunos.
34
1.5 CONSIDERAÇÕES FINAIS
Em relação à literatura existente, este artigo acrescenta a utilização de regressão
quantílica para uma estrutura de dados em painel contornando a heterogeneidade não
observada em ambientes de efeitos fixos para estimar a relação causal do tamanho da turma
nos desempenhos acadêmicos do ensino universitário brasileiro, dado a inexistência de
trabalhos com essa temática para o Brasil. Para além disso, realizam-se variações da amostra
para analisar o impacto das políticas de redução de turmas e aferir-se os efeitos dos
covariáveis estudadas.
Para tanto, optou-se pelo método abordado em Canay (2011) aplicado para um banco
de dados único referente aos registros administrativos da UFPB compilados pelo NTI e
COPERVE. Muito embora não exista um consenso em relação ao efeito do tamanho da turma,
o pressuposto básico requerido é de que essa relação é negativa e que existem variáveis
latentes como motivação e habilidade dos indivíduos que interferem nessa relação. Dessa
forma, o método contorna estes problemas e contribui fornecendo estimativas do impacto do
tamanho da classe no desempenho acadêmico, medida pelas notas obtidas ao final das
disciplinas.
Os resultados gerais sugerem que uma política de redução de turma tem efeito positivo
para aqueles indivíduos pertencentes aos baixos quantis, ou seja, aqueles indivíduos com
menor desempenho acadêmico. Por sua vez, aqueles indivíduos com maiores desempenhos,
uma política eficaz seria aumentar o número de alunos na classe. A explicação para isso é
dada em Harding e Lamarche (2014) ao inferir que alunos com notas mais altas se beneficiam
das interações com seus pares por possuírem maiores habilidade de absorção de
conhecimento. Portanto, a conclusão é de que há efeitos heterogêneos ao longo da distribuição
e aplicação de políticas de redução de turma pode prejudicar bons alunos em detrimento de
beneficiar alunos mais fracos.
Além disso, as estimativas por centro acadêmico indicam que há diferentes efeitos
entre os próprios centros de ensino. Esta constatação é plausível, uma vez que dentro da
própria instituição encontram-se diferentes perfis de alunos e professores em razão das
diversas áreas. Com isso, ressalta-se a existência de um trade-off no qual os chefes de
departamento acadêmico se deparam, uma vez que escolher reduzir turmas, além de ser uma
proposta cara, pois via de regra implica em mais insumos escolares para novas turmas, isso
também pode significar comprometer desempenho acadêmico individual e consequentemente
geral do curso. Em consonância com os demais resultados, as covariáveis apresentaram-se
como o esperado, deduz-se que i) estudantes adicionais do sexo feminino tendem a melhorar
da turma em geral; ii) adição de alunos com renda alta tem efeito negativo ao longo da
distribuição, sobretudo na cauda inferior e, iii) efeito positivo para nota de entrada
confirmando que alunos de bom desempenho no vestibular tem efeito assertivo para aqueles
ainda em realização acadêmica.
Finalmente, os resultados aqui expostos podem servir de respaldo para os
administradores universitários avaliarem melhor os efeitos do tamanho da classe no
desempenho acadêmico dos estudantes da UFPB. Além do mais, em que pese a literatura
limitada e a inexistência de trabalhos para o Brasil, é importante esclarecer que o trabalho
também abre uma agenda de pesquisa relevante. A falta de consenso sobre essa variável já dá
indícios da importância do tema.
35
1.6 REFERÊNCIAS
Alam, Mahmudul. Development of primary education in Bangladesh: the ways ahead. The
Bangladesh Development Studies, p. 39-68, 2000.
Asadullah, M. Niaz. The effect of class size on student achievement: evidence from
Bangladesh. Applied Economics Letters, v. 12, n. 4, p. 217-221, 2005.
Angrist, JOSHUA D .; LAVY, VICTOR. USANDO MAIMONIDES'RULE para estimar o
efeito da classe SIZE ON desempenho escolar. O Quarterly Journal of Economics, p. 533575, 1999.
Bandiera, Oriana; Larcinese, Valentino; Rasul, Imran. Heterogeneous class size effects: New
evidence from a panel of university students*. The Economic Journal, v. 120, n. 549, p.
1365-1398, 2010.
Banmerjee, Abhijit V. et al. Remedying Education: Evidence from Two Randomized
Experiments in India. The Quarterly Journal of Economics, v. 122, n. 3, p. 1235-1264,
2007.
Bedard, Kelly; Kuhn, Peter. Where class size really matters: Class size and student ratings of
instructor effectiveness. Economics of Education Review, v. 27, n. 3, p. 253-265, 2008.
Camargo, Juliana; Porto Júnior, Sabino. O efeito do tamanho da turma sobre o desempenho
escolar: uma avaliação do impacto da "enturmação" no ensino fundamental do Rio Grande do
Sul. Texto para discussão Nº 02, 2014.
Canay, Ivan A. A simple approach to quantile regression for panel data. The Econometrics
Journal, v. 14, n. 3, p. 368-386, 2011.
De Giorgi, Giacomo; Pellizzari, Michele; Woolston, William Gui. Class size and class
heterogeneity. Journal of the European Economic Association, v. 10, n. 4, p. 795-830,
2012.
De Paola, Maria; Ponzo, Michela; Scoppa, Vincenzo. Class size effects on student
achievement: heterogeneity across abilities and fields. Education Economics, v. 21, n. 2, p.
135-153, 2013.
Duflo, Esther; Dupas, Pascaline; Kremer, Michael. Peer Effects, Teacher Incentives, and
the Impact of Tracking: Evidence from a Randomized Evaluation in Kenya. National
Bureau of Economic Research, Inc, 2008.
Harding, Matthew; Lamarche, Carlos. Estimating and testing a quantile regression model with
interactive effects. Journal of Econometrics, v. 178, p. 101-113, 2014.
Hoxby, Caroline. Peer effects in the classroom: Learning from gender and race variation.
National Bureau of Economic Research, 2000.
Krueger, Alan B. Experimental Estimates of Education Production Functions. Quarterly
Journal of Economics, p. 497-532, 1999.
36
Machado, Matilde Pinto; Vera-Hernandez, Marcos. Does class-size affect the academic
performance of first year college students. mimeo, University College London, 2008
Menezes-Filho, Naércio Aquino. Os determinantes do desempenho escolar do Brasil. IFB,
2007.
Monks, James; Schmidt, Robert M. The impact of class size on outcomes in higher
education. The BE Journal of Economic Analysis & Policy, v. 11, n. 1, 2011.
Oliveira, Jaqueline Maria de. Custo-efetividade de políticas de redução do tamanho da classe
e ampliação da jornada escolar: uma aplicação de estimadores de matching. Rio de Janeiro:
Banco Nacional de Desenvolvimento Econômico e Social, 2010.
Uquiola, Miguel. Identifying class size effects in developing countries: Evidence from rural
Bolivia. Review of Economics and statistics, v. 88, n. 1, p. 171-177, 2006.
37
APÊNDICE A1 – NÚMERO DE INGRESSOS E EGRESSOS – UFPB, 2013.
3500
3000
2500
2000
1500
1000
500
0
Ingresso
Egresso
Fonte: Elaboração Própria a partir dos dados do NTI (UFPB).
APÊNDICE A2 – COMPARAÇÃO DE RESULTADOS DO EFEITO DA TURMA COM
DUAS MÉTRICAS
0,0120
0,0100
0,0080
0,0060
0,0040
0,0020
0,0000
-0,0020
0,1
0,2
0,3
0,4
0,5
0,6
0,7
-0,0040
-0,0060
-0,0080
CRE
NOTA
Fonte: Elaboração Própria a partir dos resultados das estimações.
0,75
0,9
0,95
38
ANEXO 1 – LISTA DOS CENTROS ACADÊMICOS E OS CURSOS DE GRADUAÇÃO
1 - CENTRO DE CIÊNCIAS EXATAS E DA NATUREZA (CCEN)
1.1 CIÊNCIAS BIOLÓGICAS
1.2 ESTATÍSTICA
1.3 FÍSCICA
1.4 GEOGRAFIA
1.5 MATEMÁTICA
1.6 QUÍMICA
8 - CENTRO DE CIÊNCIAS JURÍDICAS (CCJ)
8.1 DIREITO
2 - CENTRO DE CIÊNCIAS HUMANAS, LETRAS E ARTES
(CCHLA)
2.1 HISTÓRIA MSC
2.2 LETRAS CLÁSSICAS
2.3 CIÊNCIAS SOCIAIS
2.4 LETRAS LIBRAS
2.5 FILOSOFIA
2.6 HISTÓRIA
2.7 LETRAS
2.8 LÍNGUAS ESTRANGEIRAS APLICAS ÀS NEGOCIAÇÕES
INTERNACIONAIS
2.9 LETRAS VIRTUAL
2.10 MÍDIAS DIGITAIS
2.11 PSICOLOGIA
2.12 SERVIÇO SOCIAL
2.13 TRADUÇÃO
10 - CENTRO DE COMUNICAÇÃO, TURISMO E ARTES (CCTA)
3 - CENTRO DE CIÊNCIAS MÉDICAS (CCM)
3.1 MEDICINA
4 - CENTRO DE EDUCAÇÃO (CE)
4.1 PEDAGOGIA
4.2 PEDAGOGIA - MODALIDA À DISTÂNCIA
4.3 PEDAGOGIA - EDUCAÇÃO DO CAMPO
4.4 PSICOPEDAGOGIA
4.5 CIÊNCIAS DAS RELIGIÕES
4.6 CIÊNCIAS NATURAIS - MODALIDADE À DISTÂNCIA
9 - CENTRO DE BIOTECNOLOGIA (CBIOTEC)
9.1 BIOTECNOLOGIA
10.1 ARTES VISUAIS
10.2 TEATRO
10.3 JORNALISMO
10.4 RELAÇÕES PÚBLICAS
10.5 RADIALISMO
10.6 CINEMA
11 - CENTRO DE ENERGIAS ALTERNATIVAS E RENOVÁVEIS
(CEAR)
11.1 ENGENHARIA ELÉTRICA
11.2 ENERGIAS RENOVÁVEIS
12 - CENTRO DE INFORMÁTICA (CI)
12.1 CIÊNCIAS DA COMPUTAÇÃO
12.2 ENGENHARIA DA COMPUTAÇÃO
12.3 MATEMÁTICA COMPUTACIONAL
13 - CENTRO DE TECNOLOGIA E DESENVOLVIMENTO
REGIONAL (CTDR)
13.1 TECNOLOGIA DE ALIMENTOS
13.2 TECNOLOGIA SUCRAALCOOLEITA
5 – CENTRO DE CIÊNCIAS SOCIAIS APLICADAS (CCSSA)
5.1 ADMINISTRAÇÃO
5.2 CIÊNCIAS ECONÔMICAS
5.3 CIÊNCIAS CONTÁBEIS
5.4 ARQUIVOLOGIA
5.5 BIBLIOTECONOMIA
5.6 RELAÇÕES INTERNACIONAIS
6 - CENTRO DE TECNOLOGIA (CT)
6.1 ARQUITETURA E URBANISMO
6.2 ENGENHARIA AMBIENTAL
6.3 ENGENHARIA CIVIL
6.4 ENGENHARIA MECÂNICA
6.5 ENGENHARIA DE ALIMENTOS
6.6 ENGENHARIA DE MATERIAIS
6.7 ENGENHARIA DE PRODUÇÃO
6.8 ENGENHARIA DE MECÂNICA
6.9 ENGENHARIA QUÍMICA
6.10 QUÍMICA INDUSTRIAL
7 - CENTRO DE CIÊNCIAS DA SAÚDE (CCS)
7.1 CIÊNCIAS FARMAUCÊTICAS
7.2 ENFERMAGEM
7.3 FISIOTERAPIA
7.4 FONODIOLOGIA
7.5 EDUCAÇÃO FÍSCIA
7.6 NUTRIÇÃO
7.7 ODONTOLOGIA
7.8 TERAPIA OCUPACIONAL
Fonte: Site da UFPB disponível em: http://www.ufpb.br/content/centros-de-ensino.
39
CAPÍTULO 2: Escassez de água e os Resultados Educacionais dos Universitários do
Semiárido Brasileiro
Resumo
O presente artigo tem por objetivo investigar os efeitos das mudanças climáticas, corroborada
pelos longos períodos de secas no nordeste, no desempenho acadêmico dos jovens
universitários nascidos no semiárido brasileiro. Utiliza-se a função de tecnologia de
habilidades abarcada no modelo teórico de Cunha e Heckman (2007), onde o estoque de
capacidades é uma função das características dos pais, dos investimentos realizados pelos
pais, das características genéticas e dos fatores ambientais aqui expressos na variável logdesvio da precipitação dos 12 meses anteriores ao nascimento do indivíduo. Desta forma,
aplica-se a metodologia de regressão quantílica com efeitos fixos abordado em Canay (2011)
em um painel aluno-disciplina-ano. Os resultados sugerem que quanto maior o nível de
chuvas durante o período gestacional dos indivíduos nascidos no semiárido maior é seu
impacto no desempenho acadêmico dos mesmos. Não obstante, averiguou-se que esse efeito é
persistente e positivo ao longo da distribuição condicional de desempenho, principalmente nas
extremidades das caudas.
Palavras-chaves: Precipitação; Estoque de Capacidades; Regressão Quantílica com efeitos
fixos; Desempenho Acadêmico
Abstract
This article aims to investigate the effects of climate change, supported by long periods of
drought in the northeast, in the academic performance of students in the Brazilian semiarid
young. We use the skills of technology function encompassed the theoretical model of Cunha
and Heckman (2007), where the stock capacity is a function of the characteristics of the
parents, the investments made by the parents, genetic characteristics and environmental
factors expressed here in variable log deviation of rainfall from 12 months prior to the birth of
the individual. Thus, the quantile regression method with fixed effects discussed in Canay
applies (2011) a panel-year student-subject. The results suggest that the higher the level of
rainfall during pregnancy of individuals born in semiarid greater is its impact on the academic
performance of the same. Nevertheless, it was established that this effect is persistent and
positive throughout the conditional distribution performance, especially at the ends of the
tails.
Keywords: precipitation; Capabilities of stock; Quantile regression with fixed effects;
Academic performance
40
2.1 INTRODUÇÃO
A formação das habilidades cognitivas e não cognitivas são demasiadamente
importantes nas explicações teóricas dos resultados educacionais e deliberações políticas
sobre educação. Nesse contexto, Weiss (2010) avaliou os efeitos das habilidades cognitivas e
não cognitivas nos ganhos dos indivíduos de diferentes sistemas escolares e concluiu que há
um efeito positivo e especialmente maior na cauda superior da distribuição condicional de
rendimentos. Buttner, Thiel e Thopson (2011) investigam o papel de uma mudança na
intensidade de aprendizagem no ensino médio e constatam efeito positivo na formação de
habilidades não cognitivas. Em suma, quando os indivíduos são submetidos a experimentos
controlados, há uma persistência nos diferenciais de habilidade cognitiva e não cognitiva ao
longo da vida e com diferentes intensidades para cada fase.
Recentes pesquisas tem se debruçado em investigar as implicações de restrições nos
primeiros anos de vida sobre a formação de habilidade cognitiva e não cognitiva (Heckman,
Stixrud e Uuzua, 2006; Cunha e Heckman, 2007).Com efeito, esta formação pode ser afetada
por múltiplos e complexos fatores (Heckman, 2007), e embora possa ser afetada
negativamente por herança epigenética, a baixa cognição pode ocorrer, também, pela ausência
de condições favoráveis durante a gravidez e na infância (Currie, 2008).
Neste rol de discussões, Heckman, Stixrud e Urzua (2006) investigaram o efeito das
condições iniciais sobre os determinantes do sucesso escolar, o crime, o lucro e, em seguida,
são integrados em uma única abordagem teórica em Cunha e Heckman (2007). O autor reúne
contribuições da literatura psicológica, da neurociência e da economia, particularmente no
desenvolvimento de um quadro teórico agrupando habilidades cognitivas e não cognitivas no
conceito de capacidades. A ideia é de que o indivíduo recebe influências genéticas,
ambientais (sobretudo em experiência intrauterinas), investimentos ao longo da vida e
herdabilidade parental, que compõem a formação de suas capacidades quando adulto.
Estas conexões permitem inferir possíveis relações entre as condições climáticas
extremas e o desenvolvimento humano. Por exemplo, restrições pluviométricas propiciam
ambientes iniciais desfavoráveis, uma vez que há efeito negativo em processos produtivos, na
saúde e na qualidade de vida da região (Cirilo, 2008). A escassez de água pode reduzir a
produção agrícola e a ingestão suficiente de nutrientes afetando os resultados de saúde, e a
falta de água potável pode gerar maior incidência de doenças infecciosas comprometendo a
qualidade de vida da região (Rocha e Soares, 2015). Não obstante, estas consequências são
ainda mais danosas quando incidem sobre períodos intrauterinos e nos primeiros anos de
infância por comprometerem a formação das habilidades cognitivas e não cognitivas dos
indivíduos (Backer, 1998; Gluckman e Handson, 2005; Cunha e Heckman, 2007; Heckman,
2007).
Neste arcabouço teórico, o objetivo desta pesquisa é analisar a relação causal entre
restrições pluviométricas no período gestacional sobre as habilidades cognitivas dos
indivíduos quando adultos. Especificamente, procura-se observar se as habilidades dos
indivíduos que nasceram no semiárido brasileiro foram afetadas pelas secas, discutindo as
evidências encontradas na literatura sobre formação de habilidades cognitivas no contexto
41
brasileiro. Para isso, lança-se mão de uma painel aluno-disciplina-ano que acompanha os
indivíduos que ingressaram na Universidade Federal da Paraíba no período de 2001 à 2010,
possibilitados por um registro único de informações compiladas pelo Núcleo de Tecnologia
da Informação (NTI) – UFPB, dos quais pôde-se obter um conjunto de variáveis relacionadas
ao ambiente inicial, condições genéticas, atributos parentais, investimentos e desempenho nas
disciplinas cursadas ao longo do curso.
Nada obstante, para a consecução deste objetivo é importante frisar que se utilizou
como proxy das habilidades cognitivas quando adulto as notas das disciplinas, por permitir a
construção de um painel aluno-disciplina-ano. Isto se deve a ausência de um banco de dados
longitudinal no Brasil, ou seja, não há um banco que acompanhe temporalmente o indivíduo
no momento da gravidez até adulto. Logo, a partir da data de nascimento foi possível conectar
os dados de clima ao nascer e as informações socioeconômicas dos indivíduos e seus
respectivos desempenhos. Além disso, aplicou-se o método abordado em Canay (2011) de
Regressão Quantílica com efeitos fixos.
Além desta introdução, este trabalho está organizado da seguinte forma. Seção 2.2
apresenta-se uma breve revisão da literatura sobre a formação de habilidades dos agentes. A
seção 2.3 expõe-se o modelo teórico e empírico, bem como o banco de dados. A seção 2.4 os
resultados e a seção 2.5 as considerações finais. Finalmente, na seção 2.6 apresenta as
referências bibliográficas.
42
2.2 FORMAÇÃO DE CAPACIDADES
“Smart investments start by addressing a major root cause of inequality
- families and disadvantaged early childhoods.”
(James Heckman)
Nesta seção, objetiva-se apresentar um pouco da literatura sobre a formação de
habilidades sob a ótica de quatro literaturas: psicologia, neurociência cognitiva, economia e
epidemiologia. Há dois pontos centrais nesta discussão. O primeiro permeia o
desenvolvimento teórico da formação da cognição dos indivíduos. A multidisciplinariedade
teórica nos permite aproximar de um modelo mais realístico. O segundo é revelado pela frase
acima de James Heckman de que uma forma de dirimir desigualdades existentes em famílias
menos favorecidas deve começar nos primeiros anos de vida, isto é o mais inteligente.
2.2.1 Formação de Habilidades: Psicologia, Economia, Neurociência e Saúde
O sucesso socioeconômico dos indivíduos, comumente utilizado por um grande
escopo de pesquisadores, é em larga medida determinado por características individuais. Estas
características determinam o sucesso em diferentes dimensões de bem-estar e vem
despertando grande interesse em investigar em que medida diferenças observadas de
comportamento tem origem no desenvolvimento de habilidades. O grande desafio, contudo, é
identificar a formação destas características e obter uma descrição do comportamento destas
habilidades.
Na literatura da psicologia, Piaget (1982) destaca dois elementos básicos ao
desenvolvimento cognitivo dos indivíduos: i) fatores invariantes; e ii) fatores variantes. O
primeiro, conhecido na literatura como gênese, diz que ao nascer, o indivíduo recebe como
herança uma série de estruturas biológicas (sensoriais e neurológicas) que permanecem
constantes ao longo da vida. Por outro lado, o segundo fator expressa que o desenvolvimento
cognitivo dos indivíduos se dá a partir da interação entre o homem e o meio em que ele vive.
Além disso, inspirados pelas possibilidades de medidas de inteligência consolidadas
pela escala Binet-Simon15, Stanford-Binet16 (o teste de QI) e Spearman17 (o fator g), a
literatura psicológica contribui neste rol de discussões ao postular que: i) há um processo
cumulativo de conhecimento que varia com a idade dos indivíduos; ii) o conhecimento atual é
insumo para o aprendizado posterior; e iii) a aprendizagem são captadas de forma distintas
em diferentes fases da vida, no qual pode haver períodos em que este aprendizado pode ser
facilitado.
15
Alfred Binet e Théodore Simon desenvolveram o primeiro teste moderno de inteligência, chamada de escala
Binet-Simon (1905).
16
A escala Binet-Simon foi aprimorada pelo Professor Lewis Terman, passado a formar o mais popular teste de
Quociente de Inteligência - QI (1916).
17
Charles Spearman desenvolveu um método estatístico, traduzido na teoria do fator g, em que provou que havia
nos indivíduos um atributo capaz de captar a estrutura da inteligência.
43
A Neurociência vem a contribuir com a literatura a partir dos resultados do refutado
debate conhecido como “Nature versus Nurture”. A partir dos estudos do cérebro e sua
relação com a mente, à consciência e a cognição, distinguem que o ciclo da vida possui
períodos críticos. Nestes períodos, quanto mais expostos a novas informações e atividades,
mais circuitos neurais são criados e ampliados, e dependendo do ambiente, das circunstâncias
e das experiências vividas, maiores serão suas diferenças comportamentais (Fiori, 2008).
Assim, a partir da literatura epigenética, a literatura da neurociência cognitiva vem mostrar
que medidas de habilidades são susceptíveis tanto por influências genéticas, mas também
ambientais, inclusive em experiências intrauterinas.
Conquanto o desenvolvimento cognitivo dos indivíduos fosse amplamente difundido
na literatura psicológica e a neurociência cognitiva, sua forte correlação com os ganhos de
produtividade gerados pelo “fator humano” na produção despertou interesse entre os
economistas protuberantes a formular a Teoria do Capital Humano (ver Mincer, 1958, 1974;
Schultz, 1961, 1975; Becker, 1964, entre outros). O artigo de Schultz (1961) intitulado
“Investiment in Human Capital” foi uma das principais contribuições para a disseminação da
teoria do capital humano. Em particular, para as pesquisas voltadas a investigar as relações de
crescimento e desenvolvimento das nações.
Dentro da literatura econômica, a concepção do capital humano passou a ser
documentado tanto do ponto de vista macroeconômico quanto microeconômico. O primeiro
potencializando a produção gerando incremento de riqueza nas nações (Ver Romer, (1986,
1990); Lucas, 1988, Rebelo (1991), Mankiw, Romer e Weill (1992), Barro e Lee (2013). Por
sua vez, na segunda ótica investigando os determinantes do capital humano para promover a
própria existência econômica dos indivíduos (ver Becker e Tomes (1979), Hanushek (1970,
1979, 2007); Barros et. al., (2001); Checchi e Dardonani (2002); Ferreira e Veloso (2003) ).
No geral, a conclusão é de que melhorar a qualidade da força de trabalho é um elemento
essencial para o objetivo de crescimento econômico.
Dentro deste escopo de pesquisa em economia, o tema transborda-se em várias outras
áreas de estudo, sobretudo aquelas sob o enfoque de caracterizar o comportamento decisório
dos agentes econômicos. Em suma, a formação e determinantes do comportamento dos
atributos individuais, ou melhor, o desenvolvimento cognitivo dos indivíduos produz
heterogeneidade entre os mesmos, aclarando os diferenciais de acumulação de capital humano
(Heckman, 2007; Carneiro e Heckman, 2003) e produzindo importantes implicações em
termos de políticas públicas.
Vale ressaltar que muito embora a literatura econômica tenha evoluído nas
investigações do desenvolvimento cognitivo dos indivíduos, por exemplo, as pesquisas sobre
desigualdade de oportunidades18, ainda é possível identificar duas grandes lacunas. Primeiro,
ignora-se todo o desenvolvimento teórico da literatura psicológica em postular que existem
18
Baseado na Teoria da Justiça de Rawls (1971), Roemer (1993) postula que os resultados econômicos
individuais são consequência de dois grupos: i) variáveis de circunstância (não responsabilidade) – as
comumente encontradas na literatura de capital humano, ou seja, sexo, raça, backgroud familiar, entre outras; ii)
variáveis de esforço (responsabilidade) – cujo os indivíduos são responsáveis, por exemplo, decisão de migrar,
anos de estudos, horas trabalhadas, etc.
44
vários períodos na infância. Na verdade, o pressuposto implícito é de que os inputs na
produção de habilidades dos indivíduos são substitutos perfeitos (Cunha e Heckman, 2007),
pois se considera que a tecnologia de produção de habilidades é idêntica e independente da
idade dos indivíduos conferindo a formação de capital humano característica estática (Becker
e Tomes (1986); Lam (1999); Barros et. al (2001)).
A segunda lacuna é decorrente da primeira. Investimentos tardios em habilidades
podem não ser suficientes para remediar a carência de investimentos precoces, uma vez que
existe um trade-off de equidade-eficiência para investimentos mais tarde e não para
investimentos em estágios iniciais da vida (Cunha e Heckman, 2007). Além disso, alguns
estudos tendem a negligenciar que as habilidades são de múltiplas naturezas, por exemplo,
habilidade não cognitiva (como perseverança, aversão ao risco, motivação autoestima) e
também tem efeitos nos resultados socioeconômico dos indivíduos (Heckman, 1995). Tais
lacunas têm fortes implicações nas políticas públicas e sua existência na literatura econômica
pode gerar resultados desastrosos no caminho da igualdade de oportunidades.
Portanto, na busca resumir as principais evidências e conclusões relacionadas às
literaturas da psicologia, neurociências e economia, Cunha e Heckman (2007) desenvolvem
um quadro teórico que parte do pressuposto que as habilidades são responsáveis por uma
parcela significativa da variação encontrada em todo o sucesso socioeconômico do indivíduo.
De acordo com os autores, a junção destas três literaturas permite desenvolver um modelo fiel
para explicar seis fatos estilizados:
i.
ii.
iii.
iv.
v.
vi.
As diferenças de habilidades entre os indivíduos e entre os grupos socioeconômicos
abrem espaços para políticas em idades precoces. Uma implicação desta evidência
empírica decorre que a qualidade das escolas e dos recursos educacionais tem
relativamente pequenos efeitos sobre os déficits de habilidades e tem pouco efeito
sobre os resultados dos testes das crianças de diferentes grupos socioeconômicos;
Há períodos sensíveis e críticos do desenvolvimento da criança. Assim, algumas
habilidades são mais facilmente adquiridas em certas fases da infância do que as
outras características;
Apesar dos baixos retornos para intervenções direcionadas para adolescentes carentes,
a literatura empírica mostra altos retornos econômicos para investimentos corretivos
em jovens crianças desfavorecidas;
Se o investimento precoce em crianças desfavorecidas não é acompanhado por
investimentos mais tarde, o seu efeito em idades posteriores é menor.
Efeitos de restrição de crédito sobre os resultados de adultos dependem da idade em
que ele surgiu na família da criança. Ou seja, renda familiar durante os anos de
faculdade desempenha um papel menor na determinação da participação do indivíduo.
Habilidades socioemocionais (não cognitivas) promovem habilidades cognitivas e são
um importante produto de famílias afortunadas e intervenções bem sucedidas em
famílias desfavorecidas.
Os seis fatos elencados tem fortes efeitos na condução de políticas públicas,
principalmente em países com certo grau de subdesenvolvimento. Por exemplo, no Brasil, a
45
maior parte dos investimentos em educação é destinada a programas de incentivo ao acesso
do ensino superior ou aqueles programas de formação profissional pública e de alfabetização
de adultos. Em boa parte negligenciam-se os primeiros anos de vida dos indivíduos e
posteriormente se gasta para tentar remediar as diferenças resultantes da falta de estímulos
nos estágios iniciais do ciclo da vida.
Outro ponto que merece destaque neste trabalho, e que atualmente gera controvérsia
entre acadêmicos e políticos, compreende o primeiro ponto, uma vez que os autores
demonstram que, a priori, qualidade das escolas e dos recursos educacionais tem
relativamente pequenos efeitos sobre os déficits de habilidades. Isto não quer dizer que
qualidade educacional não seja importante, mas que investir em educação nos primeiros anos
de vida são mais eficientes e efetivos na condução de uma política pública que preze pela
igualdade de oportunidades.
Há ainda muito outros pontos relevantes na discussão apresentada por Cunha e
Heckman (2007), e que aqui se pretende explorar no desenvolvimento deste trabalho.
Portanto, configura-se o embasamento teórico aqui utilizado para investigar os efeitos da seca
dos últimos anos no Semiárido Brasileiro sobre o desenvolvimento cognitivo dos indivíduos
nascidos neste período. A hipótese é de que a restrição pluviométrica que assolou esta região
pode ter comprometido tanto o estoque de saúde dos indivíduos quanto o desenvolvimento de
suas habilidades e talvez possa explicar os baixos níveis educacionais desta região.
46
2.3 ESTRATÉGIA DE IDENTIFICAÇÃO EMPÍRICA
A estratégia empírica aqui desenvolvida permeia três aspectos. O primeiro tomar-se-á
como base teórica o modelo desenvolvido por Cunha e Heckman (2007) de investimentos em
capacidades humanas, aqui exposto e adaptado para redesenhar o problema a ser analisado.
Segundo, apresenta-se o estimador de regressão quantílica com estrutura de dados em painel
abordado em Canay (2011). Por fim, o terceiro ponto no qual se expõem os dados utilizados
na construção do painel quantílico.
2.3.1 Modelo Teórico
A família desempenha um papel crucial na formação das habilidades cognitivas e não
cognitivas, pois fornece tanto o background familiar, como as condições do meio ambiente
com os quais tais habilidades são determinadas. Na busca de formalizar as evidências da
literatura, Cunha e Heckman (2007) propõem um modelo de gerações sobrepostas de
formação de habilidades no qual agrupa evidências da psicologia, economia e neurociência.
O modelo teórico proposto por Cunha e Heckman (2007) tem como base a teoria do
ciclo da vida de formação de habilidades, em que apresenta como principal característica o
desenvolvimento de um processo dinâmico de múltiplos estágios, ou seja, o ciclo de vida dos
indivíduos é analisado considerando vários períodos e cada qual com uma taxa de retorno
diferente. A ideia é mostrar que o desenvolvimento da criança depende de um conjunto de
fatores. Assim, o modelo pode ser expresso como:
=
,
,
,ℎ ,ℎ
,
∈
,
(1)
Onde
denota o vetor de capacidades, ou seja, as habilidades cognitivas, habilidades não
denotar o vetor de investimentos cognitivos, não
cognitivas:
= ( , ). Deixe
cognitivos e capacidades de saúde: = ( , ). Use ℎ = (ℎ , ℎ ) para denotar habilidades
paramentais cognitivas e não cognitivas. A equação (1) traduz que em cada estágio t, pode-se
definir uma tecnologia recursiva para habilidades cognitivas (k = C) e as habilidades não
cognitivas, (k = N).
Em outras palavras, considera-se que os agentes possuem um vetor de capacidades em
cada idade. Pressupõe-se que, no momento da concepção, a criança recebe condições iniciais
genéticas19 e ambientais, . Além disso, para cada investimento dos pais, , gera um vetor
de habilidades, e que as capacidades parentais, h (por exemplo: QI, genes, educação, renda,
etc), geram outputs de investimentos de genes e de seus próprios pais. A tecnologia (1), na
forma recursiva, quando o indivíduo é t anos de idade por ser escrita:
=
19
(ℎ,
, )
(2)
Conforme Gluckman e Hanson (2005) e Rutter (2006), a expressão gene é desencadeada por condições
ambientais iniciais.
47
para = 1, 2, … , . Assume-se que é estritamente crescente e estritamente côncava em , e
duas vezes continuamente diferenciável para todos os argumentos. Substituindo em (2) por
,
, …, repetidamente, pode-se reescrever o estoque de recursos na fase + 1,
, em
função de todos os investimentos do passado:
(ℎ,
=
, , … , ),
(3)
= 1, … ,
Conforme Heckman (2007) esta tecnologia é suficientemente rica para descrever a
evidência de que a capacidade da criança de prestar mais atenção afeta o desempenho
acadêmico posterior, pois crianças mais saudáveis são melhores alunos20. Tal constatação é
decorrente de duas características importantes da tecnologia: i) autoprodutividade –
habilidades produzidas em um estágio aumentam as habilidades desenvolvidas nos estágios
posteriores, e surge quando
(ℎ, , )⁄
> 0; e ii) complementariedade dinâmica –
habilidades produzidas em um estágio aumentam a produtividade do investimento em
> 0.
estágios subsequentes e surge quando
(ℎ, , )⁄
Além disso, os autores afirmam que esta tecnologia capta os períodos sensíveis e
críticos postulados na literatura psicológica e da neurociência. Considere ∗ ser o período
sensível para
Mas,
∗
, assim:
=
( ,
, ,…, )
∗
( ,
=
, ,…, )
>0
≡0
ℎ,
ℎ,
, ,…,
, ,…, ,
Esta condição diz que os investimentos em
são produzidos no período
∗
∗
não em qualquer outro período ≠ . Período é o período sensível para
se:
,
,
,…,
<
∗
,
,
∗
≠
∗
, mas
,…,
Em outras palavras, o período de ∗ é um período sensível em relação ao período de s
se, ao mesmo nível de insumos, o investimento é mais produtivo na fase ∗ do que em outro
estágio ≠ ∗ . A ideia é de que no período sensível haja certa estabilidade na conectividade
dos neurônios decorrente da influência do ambiente, assim indivíduos nascidos em ambientes
restritos tendem a produzir habilidades menos eficazes. Mesmo que se invistam períodos mais
tardes, denominados de períodos críticos, este nunca será um substituto perfeito.
2.3.2 Identificação Empírica
O objetivo da pesquisa é investigar os efeitos das mudanças climáticas, corroborada
pelos longos períodos de seca no nordeste, no desempenho dos jovens universitários do
semiárido brasileiro. Assim, o estoque de capacidades do adulto ℎ (=
), é uma função
de características dos pais, condições iniciais e investimentos durante a infância e :
20
Ver Currie, 2008.
48
ℎ =
(ℎ,
(4)
, , )
Dentro deste arcabouço, busca-se averiguar, em médio prazo, os efeitos das mudanças
climáticas ocorridas nos últimos anos no semiárido brasileiro mais precisamente na Região
Nordeste sobre a formação das habilidades ou capacidades dos indivíduos nascidos nesta
região. Desta forma, considera-se um modelo simplificado de Cunha e Heckman (2007) com
dois períodos ( = 2) seguidos por um período A quando adultos ∈ ( = 1, + 2, + ) .
O Resultado do adulto,
, é produzido por uma combinação de diferentes habilidades, no
início do período = 1 e + 2:
=
( ,
, ,
,
(5)
)
Seguindo a descrição de Cunha e Heckman (2010), as habilidades evoluem da
seguinte forma. Cada indivíduo nasce com condições iniciais . O primeiro período = 1
compreende a fase intrauterina dos indivíduos, no qual sofrem influência dos ambientes
iniciais (variável desvio das chuvas nos últimos 12 meses) e fatores genéticos (variáveis como
raça e sexo), . Denota-se ℎ =
as habilidades parentais cognitivas e não cognitivas, como
renda familiar, nível de escolaridade do pai e se exerce trabalho remunerado. Por sua vez, o
período + 2 compreende a fase antes da entrada na faculdade, sendo que , gera um vetor
de habilidades em + , . Neste caso, considera-se a nota de entrada no vestibular, a rede
escolar em que o indivíduo estudou no ensino fundamental e médio.
E por fim, , , que denota choque e/ou inputs não observados que afetam o acúmulo
de habilidade de cada indivíduo. Para não incorrer em problemas de viés, decorrente da
existência de heterogeneidade não observada. Assume-se, ainda, que
pode ser
,
decomposta em dois componentes ( , ) de tal modo que podemos reescrever a equação (5)
pela tecnologia do painel:
=
=
+
+
+
(6)
Assume-se
como sendo um choque escalar independente sobre as pessoas, mas não
ao longo do tempo. É um choque comum que afeta todas as tecnologias, mas o seu efeito pode
ser diferente em cada uma das tecnologias. O componente , sua realização ocorre no final
do período t, após as opções dos investimentos serem tomados e implementados. O
pressuposto é de que as perturbações
são escalares, embora as outras variáveis possam
ser vetoriais e os distúrbios são independentes e identicamente distribuídos (iid). Para isso,
apresenta-se o estimador de regressão quantílica com estrutura de dados em painel abordado
em Canay (2011).
49
I – Estimador de Regressão Quantílica com efeitos fixos – QR(FE)
Canay (2011) apresenta um estimador consistente em que utiliza uma simples
transformação de dados para eliminar os efeitos fixos dos quantis condicionais, conforme o
modelo:
=
+
+
(
/
,
)=0
(7)
Onde ( , ) ∈ ℝ ℝ são variáveis observáveis, ( ) = e ( , ) ∈ ℝ ℝ são não
observados.
/ ,
≈ [0,1]. A função →
( ) é assumida como sendo estritamente
crescente em ∈ (0,1) e o parâmetro de interesse é assumido para ser ( ). A principal
restrição é que as heterogeneidades individuais associadas a
deve ter um efeito local puro.
Em suma, o método versa na questão em que as condições ( , ) do parâmetro
( ) podem ser identificadas e consistentemente calculadas a partir dos dados. Para estimar a
(. ) ≡
equação (7), Canay (2011) propõe um estimador simples de dois passos, sendo
∑ (. ) e
(. ) ≡ ( ) ∑ ∑ (. ), como segue:
Passo 1. Deixe
como:
para √
– estimador consistente de
≡Ε [
Passo 2. Sendo
≡
−
( )≡
−
. Estimam-se os efeitos fixos
(8)
]
e definir o estimar do dois-estágios ( ) como:
∈(.)
[ (
−
)]
(9)
Grosso modo, a ideia do método consiste em apurar o efeito fixo da variável
dependente através de um estimador de média condicional (OLS), e depois aplicar uma
regressão quantílica em dados em painel substituindo a variável dependente pelo valor
deduzido do efeito individual.
2.3.3 Descrição dos Dados
Com o intuito de medir os impactos das secas no semiárido brasileiro durante a década
de 90, ou seja, no período intrauterino dos jovens brasileiros que nasceram nesta região, sobre
o estoque de capacidades21 dos indivíduos que prestaram vestibular de 2001 à 2010, a
21
Heckman (2007).
50
pesquisa norteou-se em três bancos de dados principais: i) Núcleo de Tecnologia da
Informação (NTI); ii) Comissão Permanente de Vestibular (COPERVE); e iii) Terresterial
Precipitation: 1900-2010 Gridded Montly Times Series (versão 3.2).
O primeiro gerencia informações a respeito da trajetória acadêmica dos indivíduos e
por isso possui um registro único de informações do desempenho acadêmico. O segundo é
responsável pelo processo seletivo de alunos ingressantes nos cursos de graduação da UFPB e
possui em seus registros o questionário socioeconômico dos alunos e sua respectiva nota de
entrada nos cursos. Terceiro, tem-se os dados de precipitação utilizados nesta pesquisa. Tais
bancos de dados possibilita a construção das variáveis requeridas para atender ao objetivo
deste ensaio. Desta feita, lança-se mão de três blocos de variáveis de acordo com os períodos
analisados na pesquisa. O quadro 2.1 resume as variáveis do estudo:
Quadro 2.1 – Descrição das Variáveis.
Tipo
Variável
Clima
Bloco 1
(T=1)
Raça
Sexo
Renda
Escolaridapai
Ocupaçãomae
Bloco 2
(T+2)
Redefundamental
Redemédio
Bloco 3
(T+A)
Fonte: Elaboração Própria.
Desvio percentual da precipitação média.
Dummy para cor, assume-se 1 para brancos e 0 para não
brancos
Dummy para sexo, assume-se 1 para masculino e 0 para
feminino
Renda Familiar
Nível de Escolaridade do Pai
Dummy se o pai ou a mãe trabalha, assume-se 1 para o
exercício de trabalho remunerado e 0 o contrário.
Dummy para tipo de escola, 1 para pública e 0 para
privada no ensino fundamental
Dummy para tipo de escola, 1 para pública e 0 para
privada no ensino médio
Notavestibular
Nota de entrada no vestibular
Notadisciplina
Desempenho Acadêmico dos estudantes
Das variáveis apresentadas, cabe ressaltar que as que compõem o Bloco 1 e 2, exceto
clima, são comumente utilizadas na literatura de educação, sobretudo na de oportunidades
educacionais (Ver Roemer, 1998; Bourguignon et. al., 2007; Ferreira e Gignoux, 2008;
Gamboa e Waltenberg, 2012; entre outros). Contudo, o destaque da análise aqui referida
encontra-se nas variáveis relacionadas aos fatores climáticos. Parte-se do pressuposto de que
as flutuações de chuvas durante o período gestacional têm influência nos resultados dos
indivíduos ao nascer e ao longo da vida. Ou seja, ter nascido em regiões com períodos
restritivos de chuvas pode comprometer o estoque habilidades dos indivíduos.
Conforme averiguado no primeiro capítulo desta pesquisa, a ideia por trás é simples,
aumentos de flutuações pluviométricas implicam em melhores condições para a produção
agrícola e, consequentemente, maior disponibilidade de alimentos e nutrientes (Suliano et. al.
51
2009), bem como aumentam o acesso a água potável e redução de incidência de doenças
infecciosas (Parry et al., 2009 - IPCC). Para captar tais fatos, semelhante a análise anterior,
segue-se a construção da variável log desvio das chuvas nos últimos 12 meses, obtida:
=
− ln ( ̅ )
(10)
onde
indica a precipitação mensal no município m e mês t, ̅ é a precipitação anual
média histórica no município m, e indica o mês de nascimento de um indivíduo. Neste caso,
a média histórica será calculada para cada município no período de 1961-1990.
52
2.4 RESULTADOS
Nesta seção apresentam-se os resultados da Função de Produção Educacional
incorporada pelos efeitos das chuvas no período intrauterino dos indivíduos que nasceram no
semiárido brasileiro sobre seu desempenho na universidade, com base no modelo de Cunha e
Heckman (2007). Inicialmente, expõem-se algumas estatísticas descritivas das variáveis
selecionadas para este estudo exibidas na Tabela 2.1. Posteriormente, estima-se a equação (6)
a fim de obter inferências da relação causal comparando o método de Canay (2011) com
estimadores de média condicional padrão.
2.4.1 Estatística Descritivas
A pesquisa consiste em selecionar os indivíduos oriundos do semiárido brasileiro que
realizaram o exame de entrada do vestibular e obtiveram êxito com o ingresso nos cursos de
graduação da UFPB no período de 2001 à 2010. O painel aluno-disciplina-período e painel
município-ano-nascimento, possibilitados pelos registros administrativos gerenciados pelo
NTI e os dados meteorológicos nos primeiro anos de nascimento, respectivamente, são
interligados através da variável data de nascimento dos indivíduos. Além disso, tem-se um
conjunto de dados que caracterizam os indivíduos e se consolida em um painel com 47.157
observações. O sumário dos dados é apresentado na Tabela 2.1:
Tabela 2.1 – Estatística Descritiva
Variáveis
Número de Obs.
Média
Desempenho acadêmico
47.157
6.65
Precipitação
47.157
-0.007
Raça
47.157
0.4436
Sexo
47.157
0.559
Renda Familiar
47.056
1.979
Nível de escolaridade do pai
47.157
2.457
Pai Trabalha
40.596
0.7181
Mãe Trabalha
44.783
0.78009
Rede Escolar (fundamental)
46.574
0.4204
Rede Escolar (ensino médio)
47.103
0.6978
Nota de entrada (vestibular)
46.890
545
Fonte: Elaboração Própria a partir dos dados da pesquisa.
Desvio
Padrão
3.2326
0.3117
0.4968
0.4965
0.8048
1.1668
0.4499
0.4142
0.4936
0.4592
68.899
Mínimo
Máximo
0
-1.622
0
0
1
1
0
0
0
0
390.2
10
0.8576
1
1
3
4
1
1
1
1
752
A Tabela 2.1 apresenta a média, desvio padrão, valor mínimo e valor máximo das
variáveis selecionadas neste estudo. Averígua-se que a nota média dos alunos nas disciplinas
cursadas é em torno de 6,7, dos quais boa parte dos alunos é do sexo masculino (56%), são
considerados brancos (55,63%) e possuem renda familiar em torno de até 6 salário mínimos.
Além disso, constata-se que são filhos de pais em que a maioria trabalha tanto o pai, quanto a
mãe, e também, tem nível de escolaridade baixa, no qual tem pai analfabeto (31,79%) e com
ensino fundamental (14,57%).
53
No que tange os investimentos, a grande maioria estudou no ensino fundamental em
escola privada (57,96%), denotando investimentos nos primeiros anos de ensino, no entanto,
esses investimentos não foram acompanhados no ensino médio, uma vez que a maioria
estudou no ensino público (69,79%). Pelo teste de entrada, verifica-se que a média é de 545
pontos de um total de 1.000, sendo que o valor máximo da amostra denota 752 pontos. Por
fim, verifica-se que nesta amostra a incidência média de chuvas em um período de 12 meses é
cerca de 108 milímetros, com uma precipitação log-desvio médio de -0,007 e 9,4% das
observações correspondem as secas.
2.4.2 Efeito das Secas no desempenho acadêmico
A análise aqui requerida parte do pressuposto de que as chuvas em um ano de
nascimento têm uma relação positiva com o desenvolvimento das habilidades cognitivas e não
cognitivas dos indivíduos (Heckman, 2007; Cunha e Heckman, 2007). Isso porque os
municípios pertencentes às áreas geográficas do semiárido são caracterizados pela
irregularidade das chuvas. Restrições pluviométricas podem propiciar ambientes iniciais
desfavoráveis, uma vez que há efeito negativo na cadeia produtiva, na saúde e na qualidade de
vida da região (Cirilo, 2008).
Desta feita, investiga-se a relação causal entre precipitação no início da vida e os
resultados educacionais dos indivíduos quando adultos. Para isso, construiu-se um painel
aluno-disciplina-ano, no qual se acompanha as notas das disciplinas cursadas de um grupo de
indivíduos que nasceram no semiárido brasileiro, amparadas por um conjunto de variáveis
relacionadas as características dos indivíduos e de seus pais. A Tabela 2.2 apresenta tais
estimações sob a ótica de três estimadores: i) Estimador de dados em painel com efeitos fixos
(FE); ii) Estimador de Regressão Quantílica (QR) e; iii) Estimador de Regressão Quantílica
com Efeitos Fixos (QR(FE)). Além disso, para cada método utilizou-se a precipitação dos 13
a 24 meses antes do nascimento e a precipitação dos 12 meses posteriores ao nascimento dos
indivíduos como controle.
Na primeira linha das colunas (1), (2) e (3) tem-se que o resultado da variável de
interesse desse estudo. A coluna (1) refere-se ao resultado do estimador de Dados em Painel
com efeitos fixos, no qual se verifica uma correlação positiva e estatisticamente significativa
entre chuvas e desempenho acadêmico na magnitude de 0,2838. O método contabiliza a
heterogeneidade não observada invariante no tempo considerando-o que na média o efeito
fixo é o mesmo para todos os indivíduos, entretanto, não permite conhecer distribuição
condicional dos resultados. Já a coluna (2) contempla o estimador de regressão quantílica
padrão no qual a estimativa foi estatisticamente insignificante. O método permite caracterizar
toda a distribuição condicional de uma variável resposta e apesar de ser robusta a outliers,
capta as diferenças apenas entre os quantis.
54
Tabela 2.2 – Resultados das estimações
Variável/Método
FE
(1)
QR
(2)
QR(FE)
(3)
Chuvas antes do nascimento
0.2838***
-0.0151
0.0249***
Raça
-0.2632***
-0.0677**
-0.2159***
Sexo
-0.9885***
-0.6744***
-0.9156***
Renda familiar
-0.2387***
-0.1162***
-0.2141***
Escolaridade do pai
-0.2177***
-0.0973***
-0.1672***
Pai trabalha
0.4758***
0.2281***
0.4492***
Mãe trabalha
0.0647
-0.0694**
0.0833***
Rede Escolar (fundamental)
-0.0875***
0.0283
0.0632***
Rede Escolar (médio)
-0.0163***
-0.0532***
-0.1121***
Nota de entrada
0.0116***
0.0065***
0.0398***
(0.0714)
(0.0423)
(0.0829)
(0.0308)
(0.0231)
(0.0848)
(0.0859)
(0.0637)
(0.1275)
(0.0068)
(0.0367)
(0.0223)
(0.0225)
(0.0163)
(0.0116)
(0.0805)
(0.0297)
(0.0281)
(0.0312)
(0.0002)
(0.0303)
(0.0187)
(0.0182)
(0.0152)
(0.0089)
(0.0259)
(0.0263)
(0.0227)
(0.0262)
(0.0002)
Sim
Sim
Sim
Chuvas antes e após o nascimento
29.372
38.253
38.253
Observações
Fonte: Elaboração Própria a partir dos dados da pesquisa.
Nota: Erros padrão robustos entre parênteses. ***p-valor < 0,01. ** p-valor < 0,05. * p-valor < 0,10
Neste arcabouço de limitações e vantagens, aplicou-se o método de Canay (2011) que
seja um estimador que une os dois métodos, no qual capta a heterogeneidade não observada
que afeta a variável dependente, como também as características não observadas associadas as
covariáveis ao longo da distribuição condicional. Neste sentido, a coluna (3) apresenta
estimativa de 0,0249 estatisticamente significativa no intervalo de confiança de 99%. Este
resultado implica em quatro desdobramentos. Primeiro, ao comparar-se a coluna (1) e (3),
verifica-se que o viés da coluna (1) superestima o efeito das chuvas no período intrauterino
dos indivíduos sobre o resultado educacional.
Segundo, tem-se que o resultado sugere que aumento de precipitação durante o
período gestacional estão associados a aumentos no desempenho acadêmico universitário. Em
outras palavras, na mediana, aumentos de chuvas na região semiárida tende a aumentar cerca
de 2,5% o desempenho mediano dos estudantes. Tais constatações corroboram com a
literatura vigente (Gluckman e Handson, 2005; Heckman, 2007; Stixrud e Urzua, 2006;
Cunha e Heckman, 2007).
O terceiro desdobramento revela informações a respeito da covariáveis relacionadas
aos investimentos que os pais realizam antes da entrada nos cursos universitários. Neste
contexto, verifica-se que a nota de entrada tem efeito positivo implicando que quanto maior a
nota no vestibular, melhor o desempenho ao longo do curso. Além disso, tem-se que alunos
que estudam no ensino fundamental em escola pública tem efeito positivo. Parece que mesmo
com a qualidade de educação menor em escola pública, o acompanhamento dos pais nesse
período pode compensar tais implicações. Por outro lado, quando o indivíduo entra no ensino
médio, outras variáveis como trabalho, desinteresse, entre outros podem comprometer o
55
desenvolvimento das suas habilidades, e uma escola pública tem efeito negativo no resultado
educacional. Parece que a os investimentos em qualidade de educação do ensino médio é
determinante para o seu desempenho.
O quarto desdobramento diz respeito aos efeitos ao longo da distribuição condicional,
uma vez que o método consente conhecê-la. O Gráfico 2.1 apresenta tais estimativas com o
estimador QR(FE). Entretanto, cabe aqui ressaltar que foram realizadas estimações com o
estimador RQ para todos os quantis, porém todas as estimativas foram estatisticamente
insignificantes, portanto, suprimidas do Gráfico em questão.
Gráfico 2.1 – Evolução por quantis dos coeficientes estimados por QR(FE)
0,35
Precipitação 12 meses
0,3
0,25
0,2
0,15
0,1
0,05
0
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
Quantis
Fonte: Elaboração própria a partir das estimações.
Graficamente, confirma-se o padrão qualitativo do efeito das chuvas: positivo e
estatisticamente significativo a 1% ao longo da distribuição. A linha tracejada corresponde a
estimativa média já apresentada na Tabela 2.2 – Coluna (1), que corresponde a um efeito de
0,2838. Note que esse resultado superestima o efeito da disponibilidade de água nos período
da gravidez sobre resultado educacional principalmente nos quantis inferiores. No geral,
constata-se que o impacto da precipitação média dos últimos 12 meses antes do nascimento
cresce positivamente na medida em que cresce a desempenho acadêmico dos indivíduos.
Além disso, observam-se disparidades entre os extremos. Alunos com melhores
desempenhos, cauda superior, tem-se efeito menor das chuvas no seu desempenho, enquanto
que na cauda inferior esse efeito é maior.
Em síntese, as evidências aqui colocadas complementam a literatura da epigenética, da
neurociência e da psicologia, ao inferir que a baixa cognição dos indivíduos pode também ser
produto da ausência de condições favoráveis durante o período intrauterino (Currie, 2008). As
condições iniciais dos indivíduos tem papel relevante ao longo de toda vida (Heckman,
Sticrud e Urzua, 2006; Heckman, 2007). E servem de respaldo para a aplicação de políticas
públicas mais adequadas. Por exemplo, Cunha e Heckman (2007) advogam para política em
56
idades prematuras, uma vez que formação das habilidades são adquiridas com mais
facilidades em idades precoces.
De acordo com os autores, há baixos retornos para intervenções direcionadas para
adolescentes carentes, enquanto que a literatura empírica mostra altos retornos econômicos
em intervenções em crianças desfavorecidas. Talvez políticas de acesso ao ensino superior
tenha retorno econômico muito baixo e pode se refletir no baixo desempenho acadêmico dos
indivíduos.
57
2.5 CONSIDERAÇÕES FINAIS
Este artigo apresenta evidências de uma relação causal entre as disponibilidades de
água pluvial no semiárido brasileiro durante o período gestacional e o resultado econômico
educacional. O cenário para o exercício empírico se deve ao painel quantílico alunodisciplina-ano dos alunos que nasceram no semiárido e ingressaram nos cursos de graduação
da UFPB no período de 2001 à 2010. Alicerçado pelo modelo teórico de Cunha e Heckman
(2007) para a tecnologia de formação de habilidades, este trabalho acrescenta a utilização de
regressão por quantis para uma estrutura de dados em painel, controlando para efeitos fixos.
Os resultados sugerem que quanto maior a precipitação durante o período gestacional
dos indivíduos nascidos no semiárido maior é o desempenho acadêmico dos mesmos ao longo
dos cursos de graduação da UFPB. Tais constatações corroboram com a literatura que se
dedica aos estudos do impacto dos primeiros anos de vida dos indivíduos ao longo de sua vida
(Gluckman e Handson, 2005; Heckman, 2007; Stixrud e Urzua, 2006; Cunha e Heckman,
2007). Além disso, averiguou-se que esse efeito positivo é persistente ao longo da distribuição
condicional de desempenho, embora, varie em intensidades dos mesmos, principalmente nas
caudas da distribuição.
Não obstante, os resultados encontrados abrem caminho para outras questões
relacionadas aos determinantes do desempenho acadêmico dos universitários brasileiros,
como o papel de políticas de acesso ao ensino superior, sistema de cotas, efeitos do tamanho
da turma, entre outros. Ademais, destaca-se a importância desta pesquisa, como contribuição
para os formuladores de políticas públicas, uma vez que a condição inicial, notadamente no
período intrauterino e nos primeiro anos de vida, pode interferir na formação da cognição dos
indivíduos e persistir ao longo da vida.
58
6 REFERÊNCIAS BIBLIOGRÁFICAS
Barker, D. J. P. Mothers, Babies and Health in Later Life. Editora Churchill
Livingstone,edição nº 2, ISBN-10: 0443061653, 1998.
Barro, Robert J.; Lee, Jong Wha. A new data set of educational attainment in the world,
1950–2010. Journal of development economics, v. 104, p. 184-198, 2013.
BARROS, Ricardo Paes et al. Determinantes do desempenho educacional no Brasil. Pesquisa
e Planejamento Econômico, v. 31, n. 1, 2001.
Becker, Gary S. Investment in human capital: A theoretical analysis. The journal of political
economy, p. 9-49, 1964.
Becker, Gary S.; Tomes, Nigel. An equilibrium theory of the distribution of income and
intergenerational mobility. The Journal of Political Economy, p. 1153-1189, 1979.
Buttner, Bettina; Thiel, Hendrik; Thomsen, Stephan Lothar. Variation of learning intensity in
late adolescence and the impact on noncognitive skills. ZEW-Centre for European
Economic Research Discussion Paper, n. 11-007, 2011.
Canay, Ivan A. A simple approach to quantile regression for panel data. The Econometrics
Journal, v. 14, n. 3, p. 368-386, 2011.
Carneiro, Pedro; Heckman, James. Human Capital Policy. Institute for the Study of Labor
(IZA), 2003.
Cirilo, José Almir. Políticas públicas de recursos hídricos para o semi-árido. Estudos
Avançados, v. 22, n. 63, p. 61-82, 2008.
Checchi, Daniele; Dardanoni, Valentino. Mobility comparisons: Does using different
measures matter?. Università di Milano, Dipartimento di economia politica e aziendale,
2002.
Cunha, Flavio; Heckman, James. The economics of human development: The technology of
skill formation. The American economic review, v. 97, n. 2, p. 31-47, 2007.
Currie, Janet M. The invisible safety net: Protecting the nation's poor children and
families. Princeton University Press, 2008.
Ferreira, Sergio Guimarães; Veloso, Fernando A. Mobilidade intergeracional de educação no
Brasil. Pesquisa e Planejamento Econômico, v. 33, n. 3, 2003.
Fiori, N. As neurociências cognitivas. Tradução de Sonia M. S. Fuhrmann. Petrópolis
RJ:Vozes, 2008.
Gluckman, Peter D.; Hanson, Mark A. The fetal matrix: evolution, development and
disease. Cambridge University Press, 2005.
59
Hanishek,, Eric A. The production of education, teacher quality and efficiency. In U.S. Office
of Education, Do Teachers Make a Difference?, pages 79–99. Government Printing Office,
Washington, DC, 1970.
Hanishek,, Eric A. Conceptual and empirical issues in the estimation of educational
production functions. Journal of human Resources, p. 351-388, 1979.
Heckman, James J. Lessons from the bell curve. Journal of Political Economy, p. 10911120, 1995.
Heckman, James. The technology and neuroscience of skill formation.Invest in Kids
Working Group, Center for Economic Development, Partnership for America’s
Economic Success, July, v. 17, 2006.
Heckman, James J. The economics, technology, and neuroscience of human capability
formation. Proceedings of the national Academy of Sciences, v. 104, n. 33, p. 13250-13255,
2007.
Lam, David. Generating Extreme Inequality: Schooling, Earnings, and Intergenerational
Transmission of Human Capital in South Africa and Brazil. Research Report. 1999.
Lucas, Robert E. On the mechanics of economic development. Journal of monetary
economics, v. 22, n. 1, p. 3-42, 1988.
Mankiw, N. Gregory; Romer, David; Weil, David N. A Contribution to the Empirics of
Economic Growth. The Quarterly Journal of Economics, v. 107, n. 2, p. 407-437, 1992.
Mincer, Jacob. Investment in human capital and personal income distribution. The journal of
political economy, p. 281-302, 1958.
Mincer, Jacob A. Schooling and earnings. In: Schooling, experience, and earnings. NBER,
1974. p. 41-63.
Piaget, Jean. The origins of intelligence in children. New York: International Universities
Press, 1952.
Rebelo, Sergio. Long-Run Policy Analysis and Long-Run Growth. Journal of Political
Economy, v. 99, n. 3, p. 500-521, 1991.
Rocha, Rudi; Soares, Rodrigo R. Water scarcity and birth outcomes in the Brazilian
semiarid. Journal of Development Economics, v. 112, p. 72-91, 2015.
Romer, Paul M. Increasing returns and long-run growth. The journal of political economy,
p. 1002-1037, 1986.
Romer, Paul M. Human capital and growth: theory and evidence. In:Carnegie-Rochester
Conference series on public policy. North-Holland, 1990. p. 251-286.
Schultz, Theodore W. Investment in human capital. The American economic review, v. 51,
n. 1, p. 1-17, 1961.
60
Schultz, Theodore W. The value of the ability to deal with disequilibria.Journal of economic
literature, v. 13, n. 3, p. 827-846, 1975.
Weiss, C. The effects of cognitive and noncognitive abilities on earnings: different school
systems. European University Institute, unpublished, 2010.
61
CAPÍTULO 3: Escassez da Água e Mortalidade Infantil: Novas Evidências a partir de
um Painel Quantílico Robusto22
Resumo
Propõe-se investigar os resultados de saúde expressos na taxa de mortalidade infantil para um
painel de município-a-mês (1996-2010) do semiárido brasileiro, levando em consideração
importantes efeitos: heterogeneidade não observada, a endogeneidade existente, bem como a
confiabilidade dos dados de precipitação, até o momento negligenciado pela literatura. Os
resultados, em conformidade com a literatura, mostram um efeito negativo da precipitação e
um efeito positivo da seca sobre a taxa de mortalidade infantil dos municípios pertencentes ao
semiárido brasileiro. Contudo, ressalta-se que os efeitos de tratamento aplicados ratifica o
efeito negativo, no entanto, em magnitude inferior ao apresentado na literatura.
Palavras-chaves: Taxa de Mortalidade Infantil; Precipitação; Regressão Quantílica com
efeitos fixos; Semiárido Brasileiro.
Abstract
We propose to investigate health outcomes expressed in child mortality rate for a county-bymonth panel (1996-2010) of the Brazilian semiarid, taking into account important effects:
unobserved heterogeneity, the existing endogeneity and reliability of precipitation data so far
neglected in the literature. The results, in accordance with the literature, show a negative
effect of precipitation and a positive effect of drought on the child mortality rate in the
municipalities belonging to the Brazilian semiarid region. However, it is noteworthy that the
effects of treatment applied confirms the negative effect, however, to a lesser extent than
shown in the literature.
Keywords: Infant mortality rate; Precipitation; Quantile regression with fixed effects;
Brazilian semiarid.
22
Com coautoria de Wallace Patrick Farias.
62
3.1 INTRODUÇÃO
Há um grande número de pesquisas que investigam os impactos das condições inicias
sobre os determinantes dos resultados socioeconômicos dos indivíduos quando adultos
(Barcker, 1998; Gluckman e Handson, 2005; Cunha e Heckman, 2007; Heckman, 2007).
Dentro desse contexto, choques climáticos nos anos iniciais de vida, sobretudo relacionados
às quantidades pluviométricas, tem desempenhado papel relevante nos estudos sobre o
desenvolvimento humano (Maccini e Yang, 2006; Ugaz e Zanolini, 2011; Burguessn et. al,
2014).
Dentre as principais consequências, ressaltam-se o efeito negativo em: i) processos
produtivos (Aguilar e Vicarelli, 2011; Bezabih, Di Falco e Mekonnen, 2014); ii) na saúde
(Currie e Vogl, 2012; Currie et. al., 2013; Currie e Rossim-Slter, 2013; Rocha e Soares,
2015); iii) bem como na acumulação de capital humano (Shah e Steinberg, 2013). O
pressuposto básico é de que os choques climáticos propiciam ambientes iniciais (des)
favoráveis, uma vez que há efeito negativo/positivo na cadeia produtiva, na saúde e na
qualidade de vida da região (Cirilo, 2008).
Nesse ínterim, a questão pluviométrica vem ganhando destaque em estudos recentes.
Por exemplo, Shah e Stenberg (2013) ressaltam que exposição a períodos de seca no início da
vida tem efeitos prejudiciais nos salários, na saúde e na escolaridade dos indivíduos adultos da
área rural da Índia. Burgess, et. al. (2014) ratificam esses resultados para a Índia em termos de
mortalidade em populações rurais e urbanas, bem como altas temperaturas reduzindo salários
agrícolas e reais. No Brasil, Rocha e Soares (2015) enfatizam a escassez da água na região
semiárida do nordeste como fator determinante para a mortalidade infantil mais elevada,
menor peso ao nascer, e períodos de gestação mais curtos.
Por outro lado, Maccini e Yang (2008) investigam o efeito das condições climáticas na
época do nascimento sobre a saúde, educação e resultados socioeconômicos dos adultos
indonésios e concluem que uma maior precipitação no início da vida tem grandes efeitos
positivos sobre os resultados de mulheres adultas, mas não para homens. Este conjunto de
evidências vem atribuindo determinado grau de importância para as questões pluviométricas
no desenvolvimento humano destas regiões, contudo, é relevante ressaltar que estas
estimativas podem estar viesadas se não forem observadas questões como confiabilidade de
dados de clima e a endogeneidade existente nessas relações.
Em que pese o desenvolvimento recente da associação de clima no desenvolvimento
humano dos indivíduos, estes questionamentos merecem especial atenção para não incorrer
em possíveis sub ou superestimações de resultados, ou ainda, em erros de especificação. Tais
tratamentos são importantes na definição do correto impacto das mudanças climáticas sob
resultados de saúde, crucial para os formuladores de políticas públicas. Deste modo, o
objetivo desta pesquisa é adicionar elementos à literatura existente no intuito de reduzir
incertezas e fornecer insights sobre os resultados de saúde dos indivíduos enfatizando três
conjunturas.
63
Primeiro, considera-se que as estimativas do efeito médio da variável dependente
podem não retratar a realidade da maioria dos municípios. A explicação para tal é a existência
de heterogeneidade entre os municípios que a regressão clássica de dados de painel não capta.
Potencialmente, modelos de regressão quantílica poderiam explicar a heterogeneidade não
observada e efeitos de localização, e, concomitantemente a inclusão dos efeitos fixos dos
dados em painel comportando, assim, um modelo de regressão com estimadores mais
robustos. Nesse sentido, propõe-se averiguar as implicações de restrições pluviométricas
sobre os períodos iniciais de vida dos indivíduos ao longo da distribuição utilizando o método
de regressões quantílicas em dados de painel.
Segundo, pretende-se ampliar a análise. O ponto central é a omissão de variáveis, uma
vez que muitas pesquisas vêm atribuindo ao fator clima especial ênfase, e por ora deixando de
levar em conta outros fatores que podem afetar a mudança dos padrões de saúde que não seja
clima. Por exemplo, a distribuição geográfica e a sazonalidade de doenças transmitidas podem
alterar resultados de saúde e não necessariamente a causa disso estar nas mudanças climáticas.
Para tratar esses problemas empregou-se o método de Harding e Lamarche (2009), que seja
um estimador de regressão quantílica de um modelo de dados em painel com variáveis
independentes endógenas, no qual permite que a variável endógena possa ser correlacionada
com fatores não observados que afetam a variável resposta.
Para a consecução do método necessitar-se-á de um vetor que denote uma variável que
afeta o nível de precipitação, mas não tem efeito direto sobre os resultados de saúde dos
indivíduos. Pesquisas tem mostrado que as condições oceânicas, sobretudo a Temperatura da
Superfície do Mar (TSM), apresentam-se como a principal variável física a influenciar as
condições climáticas oriundas de dois fenômenos climáticos: El Niño23 – Oscilação Sul
(ENOS) e Dipolo Atlântico, tornando-se, portanto, o instrumento utilizado na pesquisa. Neste
caso captam-se oscilações dos Oceanos Atlântico e Pacífico que afetam a ocorrência de
chuvas no semiárido brasileiro.
Terceiro, e não menos importante, pretende-se averiguar a base de dados de clima, em
cenário com dados observacionais24, estes considerados na literatura meteorológica e
climatológica como mais confiáveis, uma vez que se verifica que boa parte da literatura
supracitada utiliza dados históricos de variações de chuvas obtidas por técnicas de reanálise25
– chamados de dados modelados. Embora ambas as variáveis reproduzam a climatologia e as
variabilidades das regiões de interesse, há um grande debate26 acerca da precisão dos dados de
reanálise em razão de sub/superestimações de intensidade de chuvas na média. Portanto,
objetiva-se testar o impacto das chuvas nos primeiros anos de vida utilizando dados
23
Ver Kayano, Rao e Moura (1988), Rao, Lima e Franchito (1993), Xavier et. al. (2003).
Dados observacionais são oriundos de estações meteorológicas de superfície. De acordo com Vieira e Piculli
(2009), há dois tipos de estações: i) convencionais – onde os dados são coletados e organizados por um
observador; e ii) automáticas – a coleta é feita através de sensores.
25
O processo de reanálise captam dados oriundos de satélites/estações, no qual acontece por duas etapas.
Primeiro são interpolados através de modelos utilizados para prever tempo e, posteriormente, novos dados são
interpolados para áreas em que não possuem dados disponíveis (Freitas, Franchito e Rao, 2010).
26
Ver Guedes et. al., 2005; Pinto et. al., 2009; Freitas, Franchito e Rao, 2010
24
64
observacionais obtidos no Banco de Dados Meteorológicos para Ensino e Pesquisa (BDMEP)
através de estimação de dados de painel com efeitos fixos.
Em síntese, a estratégia empírica adotada basear-se-á em três etapas. Primeiro,
baseado em Canay (2011), estimar-se-á por regressão quantílica com dados em painel
considerando a heterogeneidade não observada e os efeitos das covariáveis em ambientes com
efeito fixo. Segundo, visando endogeneizar a quantidade de precipitações ocorridas no
semiárido do Nordeste brasileiro, utilizar-se-á a Temperatura da Superfície do Mar (TSM),
como instrumento em um modelo empírico baseado em Harding e Lamarche (2009). Por
último, na terceira etapa, com a base dados obtidos de estações meteorológicas
observacionais, realizar-se-á estimação para comparação entre as duas diferentes bases a fim
de comprovar sub/superestimações dos resultados de Rocha e Soares (2015).
Além desta introdução, o restante do trabalho está organizado em mais quatro seções.
A próxima seção apresenta a estratégia empírica, bem como a descrição dos dados e
concepção das variáveis utilizadas nas estimações. Na terceira seção são discutidos os
resultados apurados e a quarta parte reservada para as considerações finais.
65
3.2 METODOLOGIA E DADOS
Esta seção destina-se a apresentar a estratégia adotada neste estudo. Inicialmente,
apresenta-se a contexto teórico e posteriormente o modelo empírico para avaliar o impacto
das restrições pluviométricas nos primeiros anos de nascimento nos resultados de saúde dos
indivíduos, nascidos no semiárido na década de 90. A seguir, discorre-se sobre dois métodos
adotados. O primeiro, baseado em Canay (2011) visa apresentar modelo de regressão
quantílica com dados em painel com efeitos fixos. Por sua vez, o segundo baseia-se em
Harding e Lamarche (2009) numa abordagem de regressão quantílica para modelos de dados
em painel com variáveis endógenas e efeitos individuais associados com as variáveis
independentes. Por fim, expõem-se os dados utilizados, bem como a variável instrumental
Temperatura da Superfície do Mar (TSM).
3.2.1 Contexto
O estudo da literatura da economia da saúde remonta a análise comportamental
desenvolvido por Grossman (1972) que, análogo à literatura sobre o capital humano,
considera a saúde como resultante de um processo de produção, portanto, uma variável de
estoque. A partir deste escopo, desenvolvimentos recentes relacionados a literatura da
psicologia, neurociência cognitiva, economia e epidemiologia tem destacado que a condição
inicial depende das características genéticas, mas também das condições iniciais vivenciadas
pelos indivíduos.
Nesse contexto, o modelo teórico de Heckman (2007) é aqui utilizado e adaptado para
fins desta pesquisa, e tem como base a teoria do ciclo da vida, em que apresenta como
principal característica o desenvolvimento de um processo dinâmico de múltiplos estágios, ou
seja, o ciclo de vida dos indivíduos é analisado considerando vários períodos e cada qual com
uma taxa de retorno diferente. A ideia é mostrar que o desenvolvimento da criança depende
de um conjunto de fatores.
Conforme Heckman (2007) esta tecnologia é suficientemente rica para descrever a
evidência de que a capacidade da criança em ser mais saudável afeta o resultados de saúde
posteriores. Tal constatação é decorrente de duas características importantes da tecnologia: i)
autoprodutividade – habilidades produzidas em um estágio aumentam as habilidades
desenvolvidas nos estágios posteriores, e surge quando
(ℎ, , )⁄
> 0; e ii)
complementariedade dinâmica – habilidades produzidas em um estágio aumentam a
produtividade do investimento em estágios subsequentes e surge quando
> 0.
(ℎ, , )⁄
Além disso, os autores afirmam que esta tecnologia capta os períodos sensíveis e
críticos postulados na literatura psicológica e da neurociência.
Em outras palavras, o
∗
período de
é um período sensível em relação ao período de s se, ao mesmo nível de
insumos, o investimento é mais produtivo na fase ∗ do que em outro estágio ≠ ∗ . A ideia é
de que no período sensível haja certa estabilidade na conectividade dos neurônios decorrente
66
da influência do ambiente, assim indivíduos nascidos em ambientes restritos tendem a
produzir habilidades menos eficazes. Mesmo que se invistam períodos mais tardes,
denominados de períodos críticos, este nunca será um substituto perfeito. Nesse contexto, o
objetivo da pesquisa é investigar os efeitos das mudanças pluviométricas, corroboradas pelos
longos períodos de seca no nordeste, nos resultados de saúde de jovens nascidos no semiárido
brasileiro na década de 90.
3.2.2 Estratégia empírica
A. Modelo Empírico
O painel é composto de municípios por mês segundo a região semiárida nordestina,
para o período de 1996-2010, construído com as variáveis de interesse. Assim, a análise dos
impactos das variações pluviométricas na mortalidade infantil durante o período de gestação
segue a especificação do painel de municípios por mês de nascimento abordado em Rocha e
Soares (2015):
=
+
+
+
+
+
+
(1)
onde
é um resultado de saúde médio (por município) para as crianças nascidas no
município i, no ano t e mês m. A variável dependente utilizada é a mortalidade infantil.
é
a variável de precipitação;
é um efeito-fixo para município i e mês m (com m = 1, 2, ...,
12); é um efeito-fixo ano;
é a temperatura média no município i no mesmo período de
12 meses antes do nascimento;
é a tendência temporal linear e
é o termo de erro
aleatório.
Cabe aqui destacar que a variável relacionada ao clima,
, é análoga ao realizada
em Rocha e Soares (2015), ou seja, são concebidas de mesma forma, embora difiram na
natureza do problema, uma vez que a fonte de dados e sua tabulação são diferentes entre si.
Esta variável é construída de duas maneiras, ambas para captar os efeitos das secas no
semiárido através da flutuação das chuvas durante o período de gestação dos indivíduos:
I.
Log desvio das chuvas nos últimos 12 meses – conforme os autores, esta variável
por ser interpretada como uma porcentagem de desvio da precipitação média. Definida
por:
=
− ln ( ̅ )
(2)
onde
indica a precipitação mensal no município i e mês m, ̅ é a precipitação anual
média histórica no município i, e indica o mês de nascimento de um indivíduo. Diferente
67
será realizado apenas para
ao realizado em Rocha e Soares (2015), o cálculo do ∑
os municípios pertencentes ao semiárido, uma vez que contabilizar estados onde tem
muita chuva, por exemplo, os estado do Norte, pode superestimar esta covariável.
II.
Seca dos últimos 12 meses – uma variável dummy que assume o valor 1 se houve
seca no período e 0 se o contrário. Em síntese esta variável busca captar os eventos
extremos, calculado por:
=1
<
̅ −
, 0
(3)
onde
é o histórico anual do desvio padrão de chuvas para o município i (calculado
sobre o período de 1961-1990). Em outras palavras, o
= 1 indica que a precipitação
ao longo dos 12 meses anteriores ao nascimento de um indivíduo era mais do que um
desvio padrão abaixo da média histórica para o município i.
Em suma, a equação (1) estima os efeitos das variações pluviométricas, aqui
representadas nas equações (2) e (3), sobre a taxa de mortalidade infantil em dados em painel
de município-a-mês de 1996 a 2010.
B. Métodos Empíricos
Para estimar a equação (1) é necessário considerar que os efeitos fixos por municípiomês controlam variações climáticas em determinados períodos do ano assim como diferenças
entre os municípios, enquanto que o efeito fixo por ano tenta captar choques agregados e
tendências que impactam toda a região. Por sua vez, a tendência linear controla a dinâmica da
evolução das mudanças climáticas e socioeconômicas da região, e a temperatura é responsável
por outras variações climáticas que podem estar relacionadas com a quantidade de chuvas
(Rocha e Soares, 2015).
Uma grande literatura sobre estimação de regressões quantílicas com dados em painel
tem surgido nos últimos anos, tal como Koenker (2004) que introduziu uma abordagem geral
para estimação com dados longitudinais. Controlando para os efeitos fixos municipais e a
heterogeneidade das covariáveis, a estimação por quantis é uma abordagem mais flexível para
a análise de dados em painel do que os estimadores de efeitos fixos e aleatórios gaussianos
clássicos. Em adição, considerar os efeitos de tratamento em modelos quantílicos de dados em
painel constitui mais recente robustez das análises desta natureza. Não obstante, é necessário
ir além e também captar outros efeitos na média. Portanto, neste arcabouço, apresentam-se os
dois estimadores aqui utilizados.
68
I - Estimador de Regressão Quantílica com efeitos Fixos- Canay (2011) – (QRFE)
Canay (2011) apresenta um estimador consistente em que utiliza uma simples
transformação de dados para eliminar os efeitos fixos dos quantis condicionais, conforme o
modelo:
=
+
+
(
/
,
(4)
)=0
Onde ( , ) ∈ ℝ ℝ são variáveis observáveis, ( ) = e ( , ) ∈ ℝ ℝ são não
observados.
/ ,
≈ [0,1]. A função →
( ) é assumida como sendo estritamente
crescente em ∈ (0,1) e o parâmetro de interesse é assumido para ser ( ). A principal
restrição é que as heterogeneidades individuais associadas a
deve ter um efeito local puro.
Em suma, o método versa na questão em que as condições ( , ) do parâmetro
( ) podem ser identificadas e consistentemente calculadas a partir dos dados. Para estimar a
(. ) ≡
equação (7), Canay (2011) propõe um estimador simples de dois passos, sendo
∑ (. ) e
(. ) ≡ ( ) ∑ ∑ (. ), como segue:
Passo 1. Deixe
≡Ε [
−
Passo 2. Sendo
– estimador consistente de
para √
].
≡
−
. Estimam-se os efeitos fixos como:
e definir o estimar do dois-estágios ( ) como:
( )≡
∈(.)
[ (
−
)]
O método consiste na obtenção de insights sobre os efeitos dos regressores na variável
dependente. Isto porque permite uma leitura dos efeitos heterogêneos através da
transformação dos dados, uma vez que em modelos de regressão padrão, que seguem a média,
a heterogeneidade muitas vezes não é captada.
II - Estimador de regressões quantílicas de dados em painel com variáveis instrumentais
(QRVI)
Alternativamente, considerar-se-á para efeitos de resultados, o estimador proposto por
Harding e Lamarche (2009), no qual apresentam uma abordagem de regressão quantílica para
modelos de dados em painel com variáveis endógenas. Este método é mais robusto do que o
método de Canay (2011), uma vez que potencializa as estimativas ao considerar na regressão
69
efeitos além da heterogeneidade não observada. O método é uma extensão do procedimento
de Chernozhukov e Hansen (2008) permitindo a inclusão de efeitos fixos introduzidos em
Koenker (2004). Denote o vetor de variável endógena, , na equação (4):
=
= (
+
+
= ℎ( ,
,…, ,
+
, )
,…, ,
(5)
(6)
(7)
)
onde a equação (6) define a variável endógena d relacionada a um vetor de instrumentos w
que estão estocasticamente independente de . Já a variável é estocasticamente dependente
de . A equação (7) expressa à correlação entre as variáveis e os efeitos individuais. Neste
caso, assume-se que
é independente de
e . Considere a função objetivo para o
relacionamento quantílico instrumental condicional:
( , , , , , )=
(
−
−
−
−
−
)
(8)
Onde
é um vetor de instrumentos e
= ( − 1( ≤ 0)) é uma função perda de
regressão quantílica. Seguindo o procedimento de dois passos de Chernozhukov e Hansen
(2006, 2008), temos:
Passo 1. Minimizar a função objetivo (8) para , ,
em função de e :
( , ), ( , ), ( , ) = arg min ( , , , , )
, ,
(9)
Passo 2. Em seguida, estima-se o coeficiente da variável endógena para encontrar o valor de
, no qual minimiza a função distância ponderada definida em y:
( ) = arg min ( , )
( , )
(10)
Onde A é uma matriz definida positiva. De acordo com Harding e Lamarche (2009) este
estimador é assintoticamente normal podendo ser executado para mais de um quantil
simultaneamente.
70
3.2.3 Descrição dos dados
A. Dados de Clima
O uso de variáveis relacionadas ao clima é empregado para suportar uma ampla gama
de estudos de investigação sobre o impacto destas variáveis sobre os resultados de saúde dos
indivíduos. Neste sentido, o uso de dados de precipitação e temperatura vem ganhando espaço
da literatura, pois a variabilidade destas afetam diversas atividades econômicas (Freitas,
Franchito e Rao, 2010) e costumam representar a variabilidade de sinais geofísicos e regimes
de precipitação (Guedes et. al., 2004), sobretudo na literatura climatológica. O Quadro 3.1
apresenta algumas fontes e tipo de análise.
Quadro 3.1 – Diversas Fontes e Metodologias de dados de Precipitação
Tipos de Dados
Fonte
Grade
Autores que utilizaram os dados
Freitas, Franchito e Rao, 2010;
ANEEL
-
SUDENE
-
BDMEP
-
DNOCS
-
NCEP/NCAR
~1,9º x 1,9º
CPTEC
0,4º x 0,4º
Observacionais
Reanálise
CPC/NOOA
Terrestrial Air
Temperature and
Terrestrial Precipitation
Sensoriamento
0,5º x 0,5º
Menezes, et. al (2008)
Rao et. al., 1996;
Rao, Lima e Franchito (1993)
Guedes et. al., 2005; Pinto et. al., 2009; Freitas,
Franchito e Rao, 2010;
Pinto et. al., 2009;
Rocha e Soares (2015)
GPCP
2,5º x 2,5º
Pinto et. al., 2009; Freitas, Franchito e Rao, 2010;
CMAP
2,5º x 2,5º
Pinto et. al., 2009;
TRMM
1,0º x 1,0º
Pinto et. al., 2009;
Fonte: Elaboração dos autores.
Na literatura meteorológica e climatológica, destacam-se três tipos de dados: i) dados
observacionais - estações; ii) dados de reanálise e iii) dados de sensoriamento. O primeiro é
oriundo de estações compostas por sensores isolados que registram continuamente os
parâmetros meteorológicos que são lidos e anotados por um observador a cada intervalo.
Contudo, apesar de reconhecer a fidedignidade deste tipo de observação, questões geográficas
e econômicas tem dificultado a produção de séries temporárias de longo prazo (Pinto et. al.,
2009).
Por sua vez, dados de reanálise são muito convenientes para completar as lacunas onde
não possuem informações, como por exemplo, onde não há estação meteorológica, ou mesmo,
devido a problema de obtenção de dados. No entanto, as séries históricas são geradas a partir
de modelos e são construídas com base em algum tipo de observação em superfície, inclusive
de estações. Por fim, os dados de sensoriamento remoto combinam dados de superfície com
estimativas feitas por satélite para calibrar o banco de dados.
71
É possível perceber que existe um trade-off no uso de variáveis clima. Se por um lado,
os dados observacionais são fontes mais confiáveis, a ausência de informações e as quebras
das séries de longo prazo tem dificultado as investigações climatológicas. Todavia, os dados
de reanálise dependem de fontes primárias confiáveis, modelos bem ajustados e técnicas de
obtenção robustas. Neste sentido, Silva, et. al. (2007), considerando as novas calibrações
efetuadas no modelo de obtenção dos dados de reanálise da CPC/NCAR, realizado em 2005,
constataram através dos diagramas de dispersão tendências para valores mais altos da CPC em
relação aos dados observacionais. Não obstante, os autores ainda ressaltam, consistentemente
aos estudos anteriores, que as comparações indicam menor número de dias secos, maior
número de dias de baixa precipitação, e menos eventos extremos de precipitação por grade
analisada, apesar da boa correlação existente entre as mesmas.
Outros estudos também visam comparar alguns produtos de precipitação. Por
exemplo, Freitas, Franchito e Rao (2010) que compararam os dados ANEEL (observacionais);
GPCP (sensoriamento) e NCEP/NCAR (reanálise) e concluíram que os dados de reanálise
NCEP/NCAR superestimam a precipitação no Nordeste Brasileiro e que os dados
observacionais ANNEL, apesar da ausência de dados e falhas reproduziram melhor a
climatologia. Guedes et. al. (2005) em um estudo para Fortaleza-CE compararam dados
NCEP/NCAR com os dados das estações e concluem que os dados observados e de reanálise
são comparáveis, mas o ciclo anual da reanálise parece estar um mês adiantado em relação
aos dados observados e que os desvios padrões mensais apresentam grandes diferenças. Tais
resultados são corroborados em Pinto et. al. (2009) ao concluir que os dados de reanálise
CPTEC não são capazes de representar os principais regimes de precipitação existentes no
continente, com forte tendência a superestimar a intensidade média no interior do Nordeste
Brasileiro.
Nesse arcabouço, recentemente Rocha e Soares (2015) utilizaram os dados
Terresterial Precipitation: 1900-2010 Gridded Montly Times Series (versão 3.02). Este
conjunto de séries temporais é procedente das estações do Global Historical Climatology
Nework (GHCN) e Global Suface Summary of day (GSOD) através de interpolação espacial.
Portanto, trata-se de dados de reanálise e que de acordo com os estudos supracitados podemse incorrer em superestimações de valores de precipitação e temperatura para o semiárido
brasileiro. Para fins de comparação com os resultados recentes dos autores e em virtude da
ausência de séries mais longas, neste artigo empregam-se os dados observacionais do Banco
de Dados Meteorológicos para Ensino e Pesquisa (BDMEP), obtidos através do Instituto
Nacional de Meteorologia (INMET).
A ideia é verificar se os impactos das restrições pluviométricas na época de
nascimento do individuo são realmente relevantes nos resultados de saúde quando adultos em
cenário com dados mais confiáveis de precipitação, embora isso acarrete na redução da
amostra. Isto porque este banco não possui estações para todos os municípios pertencentes do
semiárido brasileiro como também os inícios das séries históricas divergem entre elas.
Neste escopo foram criadas as duas variáveis expressas nas equações (1) e (2)
utilizando os dados obtidos na BDMEP, primeiro localizando o município através da latitude
72
e longitude; e depois, gerando os dados mensais de precipitação para cada município que
compõe o semiárido brasileiro para o período de 1977 à 2010. No total, foram geradas 8.370
observações distribuídas nos 49 municípios analisados.
B. Variável Instrumental
Para empregar o método de Harding e Lamarche (2009), que seja um estimador de
regressão quantílica de dados em painel com variáveis instrumentais necessitar-se-á de um
vetor que denote uma variável que afeta o nível de precipitação, mas não tem efeito direto
sobre os resultados de saúde dos indivíduos. Pesquisas tem mostrado que as condições
oceânicas, sobretudo a Temperatura da Superfície do Mar (TSM), apresentam-se como a
principal variável física a influenciar as condições climáticas.
Um fenômeno climático de interação oceano-atmosfera bastante investigado é o El
Niño – Oscilação Sul (ENOS). Esta variabilidade climática é cíclica, oriunda do oceano
Pacífico, com periodicidade que varia de 3 a 7 anos, duração igual ou superior a cinco meses
consecutivos (Trenberth, 1997), e podem ser detectadas através das anomalias persistentes da
TSM. Anos de El Niño (ou El Niña) estão normalmente associados à escassez (ou chuvas
abundantes). A influência dos ENOS, sobretudo no Nordeste Brasileiro, tem sido objeto de
estudo a destacas Kayano, Rao e Moura (1988); Rao, Lima e Franchito (1993); Xavier et. al.
(2003); Alves e Souza (2003); Santos e Brito (2007), entre outros.
Outro fenômeno oceano-atmosfera é o dipolo do Atlântico. Destacam-se os estudos
seminais de Hastenrath e Heller (1977), Moura e Slukla (1981), e mais recentemente, Aragão
(1998), Moraes Neto e Araújo (2007), Andreoli e Kayano (2007), entre outros. Identifica-se o
Dipolo quando as águas do Atlântico tropical estão mais quentes e do Atlântico Equatorial e
Tropical Sul estão mais frias culminando para movimentos descendentes transportando o frio
e seco inibindo a formação de nuvens e diminuindo a precipitação (Aragão, 1998).
Com base na literatura climatológica, optou-se pelos dados de temperatura dos
Oceanos Pacíficos e Atlântico, conforme as pesquisas retromencionadas, uma vez que tanto
os ENOS quanto o Dipolo Atlântico afetam a ocorrência de secas no semiárido brasileiro, mas
não afetam diretamente a taxa de mortalidade infantil nem as condições de saúde ao nascer.
Desta feita, os dados de TSM observados no Oceano Pacífico e Atlântico foram extraídos do
International Comprehensive Ocean–Atmosphere Dataset (ICOADS) e National Ocean and
Atmospheric Administration (NOAA), respectivamente.
O primeiro27 arquivo contém dados mensais em pontos de grade de 2º x 2º de latitudelongitude para um período de 1854 – até o presente composto por quatro arquivos a seguir: i)
Extremo Oriente - Niño 1 + 2 (0-10S; 90W-80W); ii) Leste Tropical - Niño 3 (5N-5S; 150W90W); iii) Leste Central Tropical - Niño 3.4 (5N-5S; 170W-120W); e iv) Tropical Central –
Niño 4 (5N-5S; 160E – 150W). Por sua vez, o segundo28 arquivo são dados com resolução
0,25º x 0,25º obtidos através de uma interpolação ótima composto de dois tipos: i) Atlântico
27
28
Ver detalhes são encontrados em Huang, et. al (2014) e Liu, et. al. (2014).
Ver detalhes em Reynolds, et. al (2007).
73
Norte (5N-20N; 60W-30W); e ii) Atlântico Norte (0-20S; 30W-10E). A Tabela 3.1 apresenta
os coeficientes de correlação de Spearman para os dados de precipitação e os dados de TSM.
Tabela 3.1 – Correlação de Spearman entre dados de Precipitação de TSM
DADOS
PRECIPITAÇÃO/TSM
BMEP
Rocha e Soares (2015)
OCEANO PACÍFICO
Niño 1 + 2
Niño 3
Niño 3.4
Niño 4
0,229
0,0047
0,239
0,0098
0,211
-0,0211
0,219
-0,019
(0,000)*
(0,000)*
(0,673)
(0,000)*
(0,056)
(0,000)*
(0,377)
(0,089)
OCEANO ATLÂNTICO
Atlântico
Atlântico Sul
Norte
-0,461
0,469
(0,000)*
(0,000)*
(0,000)*
(0,000)*
-0,480
0,472
Fonte Elaboração dos Autores
* Estatisticamente significativo a um nível de significância de 5%.
Para fins desta pesquisa, utilizar-se-á os dados de TSM com maior correlação com os
dados de precipitação. Logo, observa-se na Tabela 1 que o Niño 3.4 correspondente ao leste
central tropical do Oceano Pacífico apresenta maior correlação com as duas bases de dados de
precipitação e sendo o motivo pelo qual utilizamos na pesquisa.
74
3.3 RESULTADOS EMPÍRICOS
Para este estudo, os dados foram coletados a partir de áreas geográficas dos quais as
chuvas são bastante irregulares e o solo é raso. O semiárido nordestino brasileiro possui essas
características, e embora exista ocorrência de chuvas, historicamente são permeados por
longos períodos de secas, com características edafoclimáticas e socioeconômicas restritivas à
população em razão de sua escassez. O saldo global dos efeitos sobre a saúde é provável que
seja negativo, principalmente quando acometem indivíduos no período intrauterino ou nos
primeiros anos de nascimento (Backer, 1998; Cunha e Heckman, 2007; Heckman, 2007),
onde tendem a ser particularmente vulneráveis aos efeitos adversos.
Dentro desse contexto, a análise da relação entre as condições externas nos anos
iniciais de vida, especificamente em ambientes com escassez de água, sobre os resultados de
saúde dos adultos – aqui expressos pela taxa de mortalidade infantil, é objeto desta seção dos
quais se consideram três importantes inovações avaliadas a seguir.
3.3.1 Heterogeneidade não-observada
Ainda que de difícil identificação por não serem diretamente observáveis ou
mensuráveis, a heterogeneidade não podem ser negligenciada nas estimações. Isso se deve ao
fato de que como as estimativas se tratam de efeito médio, portanto, é plausível admitir que
estas não retratem em sua totalidade a realidade dos 1.048 municípios analisados. Além do
mais, a literatura epigenética (Fiori, 2008), na condução dos estudos de interações geneambiente, ratifica a clara distinção entre os atributos adquiridos ao longo da vida e aqueles
relacionados aos genes, muitas vezes negligenciados na literatura da economia da saúde.
Assim sendo, características não observáveis correlacionadas com a probabilidade de
exposição a ambientes desfavoráveis poderiam ser responsáveis por uma parcela dos
resultados de saúde. Outrora, condições inerentes aos indivíduos são particularmente
associadas aos seus resultados de saúde independente do ambiente em que convive. Não
obstante, é relevante considerar, também, que os indivíduos podem responder a choques
externos como a seca de forma distinta entre eles. Ademais, questões como distribuição
geográfica e sazonalidade dever-se-iam também ser consideradas.
Uma alternativa para contornar estes problemas é o método de regressão quantílica
com dados em painel proposto por Canay (2011) – denominado aqui de estimador QR(FE),
apresentados na Tabela 3.2. Para obter as estimativas, cabe aqui enfatizar que fora utilizado as
seguintes variáveis de controle: i) temperatura média dos últimos doze meses; ii) tendência
temporal baseada na grade formada pelos municípios pertencentes ao quadrado 5º x 5º de
latitude/longitude; iii) precipitação dos 13 a 24 meses antes do nascimento; iv) precipitação
nos doze meses posteriores ao nascimento dos indivíduos. Não obstante, é relevante destacar
que para cada painel construiu-se as variáveis de precipitação e seca, expressos nas equações
(2) e (3) deste estudo e apresentados no Painel (A) e (B) das Tabelas, respectivamente.
75
Tabela 3.2 - Resultados das estimações com método de Canay (2011) do período de 19962010 da Região Semiárida do Nordeste
(1)
Precipitação antes do
nascimento
Precipitação 13-24 meses
antes do nascimento
Precipitação 1-12 meses
após o nascimento
Seca antes do nascimento
Precipitação 13-24 meses
antes do nascimento
Precipitação 1-12 meses
após o nascimento
-3,25*
(1,775)
FE
(2)
(3)
Painel A – Precipitação
-5,48*** -6,14***
(1,507)
(1,989)
(4)
QR(FE)
(5)
(6)
1,09***
-2,08***
-3,02***
(0,129)
(0,134)
-0,91***
-2,74
-2,88***
(2,218)
(0,127)
(2,339)
2,54
(1,801)
Painel B – Seca
3,34***
3,73***
(1,175)
(0,141)
-1,49
(1,227)
-0,980
(2,154)
-1,812
(2,176)
(0,142)
18,83***
(0,231)
2,67***
(0,147)
2,95***
(0,161)
-1,15***
(0,125)
-2,69***
(0,132)
Observações
182.458
180.659
168.267
182.458
182.458
169.946
Número de Municípios
1.048
1.037
1.037
1.048
1.048
1.048
Fonte: Elaboração com base nas estimações.
Notas: Erros padrão robustos entre parênteses. ***p-valor < 0,01. ** p-valor < 0,05. * p-valor < 0,10. As colunas
(7) e (10) não considera nas estimações a temperatura antes do nascimento.
A Tabela 3.2 apresenta os resultados utilizando o método de dados em painel com
efeitos fixos (FE) expressos nas colunas (1), (2) e (3) e o estimador robusto de Canay (2011)
de regressão quantílica com dados em painel (QRFE) apresentados nas colunas (4), (5) e (6),
onde a variável dependente é a mortalidade infantil por cada 1000 nascimentos, mensurados
por mês de nascimento em termos de nível municipal. O Painel A interpreta a precipitação
como uma porcentagem da precipitação média, enquanto que o Painel B como uma dummy
para seca.
Vislumbrando apenas o Painel A tem-se na Coluna 1 que, em termos de magnitude,
isto representa que o aumento no nível de precipitação no período gestacional reduz em cerca
de 3% a taxa de mortalidade infantil. Tais valores aumentam quando controlado pela
temperatura média durante a gravidez (-5,48%) e nível de precipitação antes da concepção e
depois do nascimento (-6,14%), conforme a Coluna (2) e (3), respectivamente.
Posteriormente, ao comparar-se os estimadores FE(RS) e QR(FE), cabem aqui alguns
apontamentos. Primeiro, verifica-se na coluna (3) – FE(RS) - que os controles utilizados não
foram estatisticamente significativos corroborando para a conclusão de Rocha e Soares (2015)
de que níveis de chuva em outros períodos que não seja o gestacional não afetam a
mortalidade infantil. O segundo, diz respeito a implicação do primeiro, uma vez que afirmar
que as variáveis de controle não exercem influência sob a mortalidade infantil seria concluir
que nutrição materna no ano antes da concepção, bem como a nutrição e doenças no primeiro
ano de vida não são afetados pelas chuvas. Tal conclusão é justamente oposta a literatura
vigente (Glewwe e King , 2001; Cunha e Heckman, 2007, Kudamatsu et. al., 2010).
76
Terceiro, tais evidências são refutadas com o estimador QR(FE), mostrando que as
variáveis de controle são estatisticamente significativas e negativas e a principal implicação é
a redução da magnitude da variável resposta. Além do mais, verifica-se através da coluna (6)
que o efeito da precipitação de 1-12 meses após o nascimento (-2,88) é maior do que o efeito
da precipitação de 13-24 meses antes do nascimento (-0,914), corroborando para as
evidências da literatura de que os primeiros anos de vida dos indivíduos são períodos
sensíveis29 e respondem mais precisamente a choques adversos (Cunha e Heckman, 2007;
Heckman, 2007). Por exemplo, privação nutricional no início da vida decorrentes das secas
pode retrair indicadores antropométricos persistindo até a vida adulta (Aguilar e Vicarelli,
2011).
Quarto, e não menos importante, é notório que a falta de rigor metodológico imprime
um papel demasiadamente relevante para o clima nos resultados de Rocha e Soares (2015).
Notem que as colunas (1), (2) e (3) são, em números, quase o dobro das colunas (4), (5) e (6).
Em síntese, tem-se um efeito superestimado da precipitação, o que nos leva a concluir a priori
que existe condição endógena entre as variáveis relacionadas à precipitação que afetam
resultados de saúde dos indivíduos, muito embora seja consensual de que esse efeito é
negativo.
Sob outra ótica, observam-se resultados qualitativamente semelhantes para o Painel B
que apresentam estimativas considerando uma dummy de seca. Por conseguinte, os resultados
corroboram-se com os resultados do Painel A uma vez que mostra que as secas tem impacto
positivo sob a taxa de mortalidade infantil dos quais tentam captar a gravidade dos choques
destas. No geral nossos resultados confirmam os de Rocha e Soares (2015) de que
independente de como se mensura a variável precipitação, são estatisticamente significativas e
negativas. No entanto, considerando a heterogeneidade não observada verificou-se que as
estimativas dos autores estavam superestimadas.
Outro ponto importante a destacar é que o método de Canay (2015) nos permite ir
além das estimativas condicionais a média e conhecer um pouco da distribuição condicional
através dos quantis. O Gráfico 3.1 apresenta as estimativas controladas pela temperatura e
precipitação nos 12 meses antes 24 meses após do nascimento ao longo da distribuição, no
qual ressalta-se que ambas apresentaram-se estatisticamente significativas.
29
De acordo com Cunha e Heckman (2007) e Heckman (2007) mostram que etapas importantes no
desenvolvimento físico dos indivíduos pode ocorrer na infância e ter consequências para os resultados de saúde
quando adultos. São os chamados períodos sensíveis que segundo os autores decorrem da primeira infância que
vai até os primeiro quatro anos de idade.
77
Gráfico 3.1 – Estimativas do impacto das secas sob os resultados dos indivíduos ao longo da
distribuição
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
-1.000
-2.000
-3.000
-4.000
-2.433
-2.772
-2.428
-3.021
-2.886
-3.630
-5.000
-5.617
-6.000
-7.000
-5.911
-6.472
Fonte: Elaboração Própria com os resultados das estimações.
Nota: Todas as estimativas foram são estatisticamente significativos.
Verifica-se que o impacto da porcentagem da precipitação média cresce negativamente
na medida em que cresce a taxa de mortalidade infantil. Em outras palavras, é possível
perceber que o efeito é negativo, com tendência a aumentar na medida em que avançamos
através dos quantis. É interessante ressaltar que sob o ponto de vista de políticas públicas, esta
evidência tem papel importante ao identificar que choques externos tem efeito de longo prazo
e com intensidade diferenciada (Maccini, 2009).
As evidências também implicam em dizer que além dos resultados diretos em saúde,
poder-se-ia também alcançar efeitos indiretos em educação comprometendo as habilidades
cognitivas dos indivíduos (Heckman, 2007). Embora as funções cognitivas possam ser
afetadas negativamente por herança epigenética, a baixa cognição pode ocorrer, também, pela
ausência de condições favoráveis durante a gravidez e na infância (Currie, 2006). Por
exemplo, a escassez de água pode reduzir a produção agrícola e a ingestão suficiente de
nutrientes afetando os resultados de saúde, e a falta de água potável pode gerar maior
incidência de doenças infecciosas comprometendo a qualidade de vida da região (Rocha e
Soares, 2015).
Com isso, políticas voltadas a atenuar os efeitos da seca na vida intrauterina tendem a
melhorar o bem-estar dos indivíduos no longo prazo, e, quanto maior o quantil pertence o
município, melhor seria o efeito desta política pública tanto em termos de saúde quando em
educação no futuro dos indivíduos. Esta conclusão abre espaço para uma agenda de pesquisa
em economia da saúde e da educação que foge ao escopo deste artigo.
78
3.3.2 Endogeneidade
Com o intuito de ampliar a análise esta subseção baseia-se no método proposto por
Harding e Lamarche (2009) visando endogeneizar a quantidade de precipitações através de
um modelo empírico de regressão quantílica de dados em painel com variáveis instrumentais,
ora aqui chamado de estimador QR(IV). Os resultados encontram-se na Tabela 3. A inserção
de variáveis instrumentais dado que estas não pertencem à equação explicativa, mas está
correlacionada com a variável de precipitação é aqui justificada pelos fenômenos oceanoatmosfera ENOS (Rao, Lima e Franchito, 1993) e do Dipolo Atlântico (Aragão, 1998),
expressos na variável Temperatura da Superfície do Mar (TSM).
Tabela 3.3 - Resultados das estimações com método de Harding e Lamarche (2009) do
período de 1996-2010 da Região Semiárida do Nordeste
(7)
Precipitação antes do
nascimento
Precipitação 13-24 meses
antes do nascimento
Precipitação 1-12 meses
após o nascimento
1,09***
Seca antes do nascimento
18,83***
Precipitação 13-24 meses
antes do nascimento
Precipitação 1-12 meses
após o nascimento
(0,129)
QR(FE)
(8)
(9)
Painel A – Precipitação
-2,08*** -3,02***
(0,134)
(0,141)
(10)
QR(VI)
(11)
(12)
0,65***
-2,49***
-2,63***
(0,134)
(0,132)
-0,91***
-1,94***
-2,88***
-1,98***
(0,127)
(0,126)
(0,142)
(0,231)
Painel B - Seca
2,67***
2,95***
(0,147)
(0,133)
(0,161)
-1,15***
(0,125)
-2,69***
(0,132)
(0,131)
18,81***
(0,2358)
2,83***
(0,152)
2,86***
(0,156)
-2,03***
(0,127)
-1,79***
(0,120)
Observações
182.458
182.458
169.946
182.458
182.458
169.946
Número de Municípios
1.048
1.048
1.048
1.048
1.048
1.048
Fonte: Elaboração dos autores com base nas estimações.
Nota 1: Erros padrão robustos entre parênteses. ***p-valor < 0,01. ** p-valor < 0,05. * p-valor < 0,10.
Nota 2: Os resultados por quantis encontram-se no anexo I.
São transportados para a Tabela 3.3, colunas (7), (8) e (9) os resultados já
apresentados nas colunas (4), (5) e (6) da Tabela 3.2 no que concernem as estimativas obtidas
através de Canay (2011). Por sua vez, as colunas (10), (11) e (12) mostram os resultados para
o estimador EQD(IV), que intuitivamente tem as mesmas conclusões do estimador QR(FE),
exceto pelas magnitudes dos parâmetros que diminuem em absoluto. Enquanto que Rocha e
Soares (2015) concluíram que aumentos de precipitação nos primeiros anos de vida pode
reduzir em torno de 6% a taxa de mortalidade infantil, o estimador EQD(IV) demonstra que
seu poder redutor resume-se em apenas 2,6%. Tais evidências são encontradas também por
quantil, conforme Anexo I, no qual as variáveis instrumentais foram significativas.
Sob outro prisma, o Painel B apresenta uma variante do nível de precipitação. Denotase a variável seca uma dummy que quando assumido valor 1 significa que a precipitação ao
79
longo dos 12 meses anteriores ao nascimento era mais do que um desvio padrão abaixo da
média histórica. Com esta medida a interpretação se inverte, espera-se sinal positivo desta
relação, conforme se verifica nos resultados dos estimadores aqui utilizados. Contudo,
análogo à análise anterior, constata-se que os resultados de Rocha e Soares (2015) também
foram superestimados provavelmente pelos problemas de endogeneidade não contabilizados.
Em suma, apesar dos resultados entre os estimadores serem semelhante
qualitativamente, o que corrobora para a aplicação de políticas públicas voltadas a amenizar
os efeitos das secas, é relevante destacar que as evidências correspondentes apontam um trato
demasiadamente elevado ao status clima nos resultados de saúde dos indivíduos. Ademais,
suspeita-se que esse quórum superestimado dos parâmetros possa, além do método
inadequado, também ser decorrente do uso inapropriado de dados de precipitação, conforme
analisado na próxima subseção.
3.3.3 Dados Observacionais
É consensual que dados históricos de chuvas e temperatura são boas medidas para
verificar seu impacto sobre os resultados de saúde dos indivíduos, principalmente em regiões
como a semiárida brasileira que é acometida por longos períodos de secas, e, que,
consequentemente deve gerar ônus para sua população residente. Umas das justificativas para
seu uso é que a variabilidade destas afetam diversas atividades econômicas (Freitas, Franchito
e Rao, 2010), o que potencializa seu impacto, principalmente em regiões subdesenvolvidas e
dependentes da agricultura (Cirilo, 2008).
Um dos desafios centrais da literatura ao analisar a relação entre a precipitação no
início da vida e os próprios resultados de saúde dos indivíduos é que os dados de precipitação
utilizados são suscetíveis a erro. Mas como isso ocorre? Isto porque o nível de precipitação é
obtido através de estações meteorológicas que em virtude das dificuldades geográficas e do
custo de mantê-las, muitas vezes não abrangem um contingente territorial representativo.
Além disso, mesmo em locais onde existam estações meteorológicas, pelas mais diversas
razões, pode-se gerar problemas que as tornem cronologicamente descontínua (Pinto et. al.,
2009). Para contornar este problema, surgem na literatura às chamadas séries de reanálise
baseados em modelos matemáticos, como por exemplo, interpolação linear, entre outros. No
entanto, a contra gota é que essa medida também contém erros que podem superestimar as
variabilidades climatológicas estudadas.
Os dados de reanálise são modelados com a média entre dois pontos de grade
distanciados entre si em diferentes resoluções espaciais baseados nas distâncias de latitude e
longitude (equivalente a km). Quanto maior a resolução, maior a distância entre os pontos. No
entanto, as diferenças entre Observacionais e Reanálise poderiam decorrer das diferentes
representatividades dos dados utilizados, ora aqui questionado. Para consolidar as conclusões
aqui expostas, utilizou-se os dados de reanálise a Terrestrial Air Temperature and Terrestrial
Precipitation: 1900–2010 Gridded Monthly Time Series, versões 3.01 e 3.02, respectivamente
80
(Matsuura and Willmott, 2009) utilizados em Rocha e Soares (2015), considerando apenas os
municípios do semiárido em que tem informações na base de dados observacional.
No que tange a escolha dos dados observacionais, optou-se pelos dados obtidos no
BDMEP, para testar se erro de medição clássica na variável precipitação no início da vida
leva a estimativa dos coeficientes atenuados. Muito embora a escolha da base implique em
redução da amostra estudada, não há embargo uma vez que estamos comparando mesmos
municípios. Portanto, resume-se em 47 municípios analisados em uma amostra de 8.070
observações. No que se refere a questão metodológica, optou-se pelo método de Harding e
Lamarche (2009) uma vez já comprovados nas seções anteriores como mais adequado para
estimar a relação aqui investigada em virtude deste captar a heterogeneidade não observada e
tratar a endogeneidade existente.
Tabela 3.4 - Resultados das estimações de comparação de dados de Reanálise e
Observacionais do período de 1996-2010 da Região Semiárida do Nordeste
Dados de Reanálise
(14)
(15)
Painel A – Precipitação
-5,79***
-4,60*** -4,26***
(13)
Precipitação antes do
nascimento
Precipitação 13-24 meses
antes do nascimento
Precipitação 1-12 meses
após o nascimento
Seca antes do nascimento
Precipitação 13-24 meses
antes do nascimento
Precipitação 1-12 meses
após o nascimento
(0,897)
(0,958)
(1,020)
(16)
Dados Observacionais
(17)
(18)
-4,42***
(0,924)
4,56***
(0,972)
-2,83**
-2,52***
-7,72***
(1,124)
(0,944)
(1,361)
Painel B – Seca
4,36***
5,52***
(1,194)
(1,040)
0,27
(0,956)
20,44***
-3,80***
(1,683)
0,34
(0,981)
-1,77*
(0,950)
(1,239)
10,72***
(1,477)
4,35***
(1,454)
4,09***
(1,385)
-2,73**
(1,126)
-7,52***
(1,178)
Observações
8.070
8.070
7.541
8.070
8.070
7.541
Número de Municípios
47
47
47
47
47
47
Fonte: Elaboração dos autores com base nas estimações.
Notas: Erros padrão robustos entre parênteses. ***p-valor < 0,01. ** p-valor < 0,05. * p-valor < 0,10. As colunas
(13) e (16) não considera a temperatura antes do nascimento nas estimações.
A sinopse dos resultados é apresentada na Tabela 3.4, dos quais as colunas (13), (14) e
(15) com estimativas dos dados de reanálise, enquanto que as colunas (16), (17) e (18) expõe
os dados observacionais. Para ambos os resultados, considerou-se a Temperatura do Oceano
Atlântico (TSM) como variável instrumental. Observa-se que a maioria dos resultados foram
estatisticamente significativos e negativos, ratificando os resultados anteriores, contudo,
merece atenção alguns fatos.
A primeira conclusão, a priori, é que de fato variáveis oriundas de reanálise tendem a
superestimar os parâmetros desta relação. Notem que para cada coluna o parâmetro estimado
com dados de reanálise são maiores do que aqueles estimados com dados de precipitação
81
observacionais. Com isso, vale aqui destacar duas importantes reflexões. Primeiro, chama-se
atenção para a Tabela 3.4, coluna (15), que o controle precipitação de 13-24 meses antes do
nascimento não é estatisticamente significativo nos dois estimadores (variável precipitação e
seca), dando apenas importância para a precipitação após a concepção dos indivíduos. Parece
que reduzir a amostra potencializa erro de medição da variável comprometendo os resultados.
A segunda reflexão se concentra na coluna (17), em que apresenta coeficiente positivo.
Quando não controlado pelas variáveis de precipitação antes e depois do nascimento, o
resultado é contraditório. Seria plausível pensar que como estamos em um número reduzido
de municípios, talvez para os municípios pertencentes a amostra, esse resultado fosse
amplamente aceito, no entanto, a coluna (18) mostra ser conivente com a literatura e com os
demais resultados aqui explorados de que aumento de chuvas no período de nascimento
tendem a reduzir a taxa de mortalidade infantil.
Com vistas a esses resultados, frisa-se que os efeitos de tratamento desse estudo
ratifica o efeito negativo entre precipitação e mortalidade infantil, contudo, em magnitude
inferior ao apresentado em Rocha e Soares (2015).
82
3.4 CONSIDERAÇÕES FINAIS
O objetivo do trabalho foi avaliar o impacto dos resultados pluviométricos e de
períodos de seca na taxa de mortalidade infantil no semiárido nordestino, a fim de ratificar ou
não os resultados encontrados na literatura. Para tanto, utilizou-se três abordagens: i) método
de regressão quantílica com dados em painel de efeitos fixos relatado em Canay (2011); ii)
método de regressão quantílica com dados em painel com variáveis instrumentais
proporcionado em Harding e Lamarche (2009) utilizando a Temperatura do Oceano como
variável instrumental; iii) dados observacionais para contrapor os de reanálise.
Os resultados indicam um efeito negativo da precipitação e um efeito positivo da seca
na taxa de mortalidade infantil, para as três estratégias. No entanto, a ausência de tratamento
no que concerne considerar a heterogeneidade não observada e a endogeneidade, bem como o
uso de dados modelados, revelam possíveis superestimações. Dessa forma, os efeitos de tais
fenômenos naturais na redução da mortalidade infantil existem, mas o seu impacto pode ser
menor do que o comumente aceito, sendo a maior parte do impacto devido a outros fatores,
tais como as condições de saúde dos munícipios, entre outros.
Logo, as principais conclusões são: i) quanto maior a precipitação antes da concepção,
durante o período gestacional e nos primeiros anos de vida dos indivíduos nascidos no
semiárido menor a taxa de mortalidade infantil nesta região; ii) quando controlado a
heterogeneidade não observada e a endogeneidade existente nesta relação, a precipitação tem
menor peso indicando que existem outras variáveis que afetam os resultados de saúde; iii) o
método utilizado em Rocha e Soares (2015) não é adequado para estimar essa relação. Sem
embargo, o Painel B, que considera a variável seca, apresentam as mesmas conclusões sob
ângulo oposto.
Em síntese, temos que bebês nascidos nas zonas áridas que sofrem secas quando no
útero de suas mães residentes no semiárido enfrentam risco maior de morte, especialmente se
nasceram quando as secas comprometem os seus primeiros anos de vida e quando a escassez
de água afeta a nutrição materna antes da concepção desses indivíduos. Trabalhos como o de
Maccini e Yang (2009), Kudamtsu et. al (2010); Aguilar e Vicarelli(2011), Shah e Steberg
(2013), Burgess et. Al (2014) e Rocha e Soares (2015) tem ressaltado os efeitos das questões
climáticas nos resultados de saúde, contudo, este estudo vem a contribuir ao ressaltar a
importância de escolher métodos adequados que tratem os problemas existentes, bem como a
escolha de dados confiáveis e que sejam fidedignos da relação causal a ser estudada.
83
3.5 REFERÊNCIAS BIBLIOGRÁFICAS
ALVES, José M. Brabo; SOUZA, R. O.; CAMPOS, José Nilson B. Previsão da anomalia de
temperatura da superfície do mar (tsm) no atlântico tropical, com a equação da difusão de
temperatura. Revista Climanalise, ano, v. 3, p. 163-172, 2003.
ANDREOLI, Rita Valéria; KAYANO, Mary Toshie. A importância relativa do atlântico
tropical sul e pacífico leste na variabilidade de precipitação do Nordeste do Brasil. Revista
Brasileira de Meteorologia, v. 22, n. 1, p. 63-74, 2007.
AGUILAR, Arturo; VICARELLI, Marta. El Nino and Mexican children: medium-term
effects of early-life weather shocks on cognitive and health outcomes. Cambridge, United
States: Harvard University, Department of Economics. Manuscript, 2011.
ARAGÃO, José Oribe Rocha. O Impacto do ENSO e do Dipolo do Atlântico no Nordeste do
Brasil. Bull. Inst. fr. études andines, v. 27, n. 3, p. 839-844, 1998.
ARAÚJO COSTA, José. O FENÔMENO EL NIÑO E AS SECAS NO NORDESTE DO
BRASIL. EDUCTE: Revista Científica do Instituto Federal de Alagoas, v. 3, n. 1, 2014.
BARKER, D. J. P. Mothers, Babies and Health in Later Life. Editora Churchill
Livingstone,edição nº 2, ISBN-10: 0443061653, 1998.
BRAHMANANDA RAO, V.; DE LIMA, Marley C.; FRANCHITO, S. H. Seasonal and
interannual variations of rainfall over eastern northeast Brazil.Journal of Climate, v. 6, n. 9,
p. 1754-1763, 1993.
BEZABIH, Mintewab; DI FALCO, Salvatore; MEKONNEN, Alemu. On the Impact of
Weather Variability and Climate Change on Agriculture: Evidence from Ethiopia. 2014.
BURGESS, Robin et al. The unequal effects of weather and climate change: Evidence from
mortality in india. Unpublished working paper, 2013.
CANAY, Ivan A. A simple approach to quantile regression for panel data. The Econometrics
Journal, v. 14, n. 3, p. 368-386, 2011.
CIRILO, José Almir. Public water resources policy for the semi-arid region.estudos
avançados, v. 22, n. 63, p. 61-82, 2008.
CUNHA, Flavio; HECKMAN, James. The technology of skill formation. National Bureau
of Economic Research, 2007.
CURRIE, Janet. Healthy, wealthy, and wise: Socioeconomic status, poor health in
childhood, and human capital development. National Bureau of Economic Research, 2008.
CURRIE, Janet et al. Something in the water: Contaminated drinking water and infant
health. Canadian Journal of Economics/Revue canadienne d'économique, v. 46, n. 3, p.
791-810, 2013.
84
CURRIE, Janet; VOGL, Tom. Early-life health and adult circumstance in developing
countries. National Bureau of Economic Research, 2012.
CURRIE, Janet; ROSSIN-SLATER, Maya. Weathering the storm: Hurricanes and birth
outcomes. Journal of health economics, v. 32, n. 3, p. 487-503, 2013.
FIORI, N. As neurociências cognitivas. Tradução de Sonia M. S. Fuhrmann. Petrópolis
RJ:Vozes, 2008.
FREITAS, Ana Carolina Vasques; FRANCHITO, Sérgio Henrique; RAO, Vadlamudi
Brahmananda. Analise dos dados de precipitacao provenientes de diferentes fontes sobre a
américa do sul, com enfase no brasil. CLIMEP-Climatologia e Estudos da Paisagem, Rios
Claros, PR, Brasil, v. 5, n. 1, 2010.
GALVAO, Antonio F.; LAMARCHE, Carlos; LIMA, Luiz Renato. Estimation of censored
quantile regression for panel data with fixed effects. Journal of the American Statistical
Association, v. 108, n. 503, p. 1075-1089, 2013.
GLEWWE, Paul; KING, Elizabeth M. The impact of early childhood nutritional status on
cognitive development: Does the timing of malnutrition matter?. The world bank economic
review, v. 15, n. 1, p. 81-113, 2001.
GLUCKMAN, Peter. e HANSON, Mark. The fetal Matrix: Evolution, Development, and
Disease. Cambridge: Cambridge University Press, 2005.
GROSSMAN, Michael. The demand for health: a theoretical and empirical
investigation. NBER Books, 1972.
GUEDES, R et al. Série temporal de precipitação mensal de Fortaleza, Brasil: Comparação
entre observações e dados de reanálise do NCEP/NCAR. Revista Brasileira de Meterologia,
v. 20, p. 83-92, 2005.
HARDING, Matthew; LAMARCHE, Carlos. A quantile regression approach for estimating
panel data models using instrumental variables. Economics Letters, v. 104, n. 3, p. 133-135,
2009.
HASTENRATH, S.; HELLER, L. Dynamics of climatic hazards in north-east Brazil.
Quartely Journal of the Royal Meteorological Society, v. 110, p. 411-425, 1977.
HECKMAN, James. The technology and neuroscience of skill formation.Invest in Kids
Working Group, Center for Economic Development, Partnership for America’s
Economic Success, July, v. 17, 2007.
KAYANO, Mary Toshie; RAO, Vadlamudi Brahmananda; MOURA, Antonio Divino.
Tropical circulations and the associated rainfall anomalies during two contrasting
years. Journal of Climatology, v. 8, n. 5, p. 477-488, 1988.
KOENKER, Roger. Quantile regression for longitudinal data. Journal of Multivariate
Analysis, v. 91, n. 1, p. 74-89, 2004.
85
KUDAMATSU, Masayuki; PERSSON, Torsten; STRÖMBERG, David. Weather and Infant
Mortality in Africa. 2012. Manuscrito não publicado.
MACCINI, Sharon L.; YANG, Dean. Under the weather: Health, schooling, and economic
consequences of early-life rainfall. National Bureau of Economic Research, 2008.
MORAES NETO, João M.; BARBOSA, Marx P.; DE ARAÚJO, Alexandre E. Efeito dos
eventos ENOS e das TSM na variação pluviométrica do semi-árido paraibano. R. Bras. Eng.
Agríc. Ambiental, v. 11, n. 1, p. 61-66, 2007.
MOURA, A. D.; SHUKLA, J. On the dynamics of the droughts in Northeast Brazil:
observations, theory and numerical experiments with a general circulation model. Journal
Atmospheric Science, v. 38, n. 12, p. 2653-2673, 1981.
PINTO, L. et al. Comparação de produtos de preCIpItação para a amérICa do sul. Revista
Brasileira de Meteorologia, v. 24, n. 4, p. 461-472, 2009.
ROCHA, Rudi; SOARES, Rodrigo R. Water scarcity and birth outcomes in the Brazilian
semiarid. Journal of Development Economics, v. 112, p. 72-91, 2015.
SANTOS, C.; BRITO, J. Análise dos índices de extremos para o semi-árido do Brasil e suas
relações com TSM e IVDN. Revista Brasileira de Meteorologia, v. 22, n. 3, p. 303-312,
2007.
SHAH, Manisha; STEINBERG, Bryce Millett. Could droughts improve human capital?
evidence from india. Unpublished manuscript, last modified, 2012.
SILVA, Viviane BS et al. An improved gridded historical daily precipitation analysis for
Brazil. Journal of Hydrometeorology, v. 8, n. 4, p. 847-861, 2007.
TRENBERTH, K. E. The definition of El Niño. Bulletin of the American Meteorological
Society, v.78, n.12, p.2771-2777. 1997.
UGAZ, Jorge; ZANOLINI, Arianna. Effects of extreme weather shocks during pregnancy and
early life on later health outcomes: the case of philippines? typhoons. 2011.
XAVIER, T. M. B. S.; XAVIER, A. F. S.; SILVA-DIAS, M. A. F.; SILVA-DIAS, P. L.
Interrelações entre Eventos ENOS (ENSO), a ZCIT (ITCZ) no Atlântico e a Chuva nas Bacias
Hidrográficas do Ceará, Revista Brasileira Recursos Hídricos, v. 8, n. 2, p. 111-126. 2003.
86
Anexo I – Resultados por quantil do Estimador QRD(FE)
Quantil
Coeficiente
IV atlântico
IV pacífico
0.1
-1,521***
-0,315***
0,212***
(0,134)
(0,033)
(0,028)
-1,729***
-0,316***
0,210***
(0,124)
(0,030)
(0,026)
-2,279***
-0,355***
0,214***
(0,108)
(0,029)
(0,024)
-2,405***
-0,368***
0,213***
(0,110)
(0,029)
(0,023)
-2,627***
-0,414***
0,220***
(0,133)
(0,033)
(0,026)
-3,457***
-0,455***
0,180***
(0,172)
(0,042)
(0,034)
-6,310***
-0,648***
0,075
(0,311)
(0,082)
(0,071)
-8,143***
-1,604***
-0,486***
(0,736)
(0,219)
(0,166)
-4,965***
-3,186***
-1,907***
(1,531)
(0,487)
(0,352)
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
Fonte: Elaboração dos autores.
87
CONSIDERAÇÕES FINAIS
Na área de economia, sobretudo em econometria aplicada, tem-se utilizado modelo de
dados em painel. Contudo, a maioria dos estimadores são projetados para modelos com
distribuição gaussiana e, apesar de captar a heterogeneidade não observada através dos efeitos
fixos, não conseguem estimar os efeitos heterogêneos das covariáveis que são muitas das
vezes importantes para o desenho das políticas públicas. Modelos de Regressão Quantílica,
por sua vez, permitem conhecer a distribuição condicional dos efeitos, porém, os estimadores
comumente utilizados não permitem a inclusão dos efeitos fixos para controlar covariáveis
latentes. Neste sentido, a estratégia do presente trabalho é aplicar técnicas de Regressão
Quantílica com estrutura de dados em painel que permite a inclusão dos efeitos fixos para três
temas em economia social. Portanto, a contribuição da tese é adicionar elementos a literatura
da educação e saúde com estimadores mais robustos.
Os resultados gerais sugerem um efeito superestimado das variáveis de interesse
quando não contabilizados a heterogeneidade não observada e os efeitos das covariáveis.
Neste contexto, encontrou-se no primeiro ensaio os seguintes resultados. O tamanho da turma
tem um efeito negativo, mas não persistente entre os quantis de desempenho acadêmico. Tal
constatação indica que políticas de redução de turma causariam efeitos benéficos em alunos
com menores notas, pois, parte-se do pressuposto de que estes poderiam se beneficiar de
maiores interações entre aluno e professor. Além disso, classes menores possibilitariam os
docentes a se dedicarem mais tempo na preparação de materiais complementares as aulas
expositivas e atendimento fora de sala de aula. Tal apontamento é ratificado pela covariável
carga horária exercida no semestre pelo docente, onde apresenta um efeito negativo sobre o
desempenho para todos os quantis, principalmente na cauda inferior. Por outro lado,
considerando alunos de alta performance normalmente possuem maiores habilidades
potencializadas pela interação com seus pares, e, portanto, redução do tamanho da turma os
prejudicaria.
Já os efeitos das chuvas no período gestacional sobre os resultados de educação e
saúde, foram investigados no segundo e terceiro ensaio, respectivamente. No que tange à
educação, utilizou-se a base de dados da UFPB dos alunos que nasceram no semiárido com o
objetivo de averiguar os efeitos das condições ambientais iniciais, notadamente o nível de
precipitação média ocorrida no período intrauterino, sobre o desempenho acadêmico na
faculdade. Os resultados mostraram uma relação positiva e persistente ao longo dos quantis.
Ao considerar a variável dependente a taxa de mortalidade infantil como uma proxy para os
resultados de saúde em um painel município-a-mês, o terceiro ensaio concluiu que quanto
maior a precipitação antes da concepção, durante o período gestacional e nos primeiros anos
de vida, menor são as taxas de mortalidade infantil dos municípios e que esse efeito tende a
aumentar a medida em que avançamos através dos quantis, indicando que choques externos
na vida intrauterina tem efeito no longo prazo e com diferentes intensidades.