Tese Gabriela Mourà o de Almeida - Final
Tese Gabriela Mourà o de Almeida - Final
Tese Gabriela Mourà o de Almeida - Final
CAMPUS DE JABOTICABAL
2023
UNIVERSIDADE ESTADUAL PAULISTA - UNESP
CAMPUS DE JABOTICABAL
2023
DADOS CURRICULARES DA AUTORA
1.1 Introdução
e com potencial de expansão (Demattê et al., 2019). Porém, a cada dia este setor vem
como uma abordagem dinâmica que pode ajudar a aumentar os resultados agrícolas
Nos últimos anos, com o rápido aumento na disponibilidade de dados abertos, com a
estatísticos para que ela possa executar a atividade que lhe foi atribuída para resolver
implica em uma maior complexidade, pois é influenciado por atributos físicos, químicos
e biológicos, cuja interação condiciona sua variabilidade espacial (Moral et al., 2019a).
Devido toda esta complexidade foi desenvolvida uma linha de pesquisa dentro da
ciência do solo que utiliza a matemática para explicar a variabilidade do solo, que é a
pedometria.
por McBratney et al. (2019) os sensores e a aprendizagem de máquina (AM) são agora
principalmente em países de clima tropical como o Brasil (Minasny and McBratney, 2016)
variações de alta magnitude dos fatores e processos de formação dos solos (Minasny
e Hartemink, 2011a). Segundo (Camargo et al., 2009) quanto maior a diversidade destes
fatores numa área, principalmente do material de origem e relevo, mais variável são
e alumínio (goethita, hematita, gibbsita) (Eberhardt et al., 2008a). Estes minerais são
3
1.2.1 Pedometria
em apenas 10% destas áreas são utilizadas técnicas de agricultura de precisão (AP),
o que, ainda assim, compreende cerca de 200.000 análises de fertilidade do solo por
fertilidade do solo (Ramaroson et al., 2018), o que torna a análise pouco atraente para
utilizados durante os procedimentos laboratoriais, que podem vir a ser nocivos ao meio
ambiente, além do alto nível de periculosidade para quem realiza a análise (Ng et al.,
2020a)
variabilidade dos atributos (Liu et al., 2020). Isto, afeta principalmente os países que
4
métodos mais sofisticados (McBratney et al., 2003). Dentro desta evolução, segundo a
mapas convencionais do solo não adequados para aplicação de manejo que requer o
conhecimento da variabilidade dos atributos (Liu et al., 2020). Isto afeta principalmente
alternativas para caracterizar os atributos do solo e suas variações espaciais, por meio
ser avaliada por análises tradicionais, novas possibilidades surgiram, como métodos
como grau de intemperismo do solo (Kragt et al., 2012; Teixeira et al., 2022; L. Zhao
et al., 2022a), pH do solo (Merl et al., 2022; Silva et al., 2021), Material de origem e
mineralogia do solo (Mancini et al., 2022; Mendes et al., 2021; Silva et al., 2022b,
2021; L. Zhao et al., 2022a), atributos e fertilidade do solo (Andrade et al., 2022;
Mendes et al., 2021; Silva et al., 2021; Xu et al., 2019; L. Zhao et al., 2022a), carbono
orgânico do solo (Faria et al., 2022; L. Zhao et al., 2022a) e metais pesados (Silva et
2020; Goldshleger et al., 2004; Nocita et al., 2015; Reda et al., 2019). A análise destes
emissão de raios X de alta energia que atingem os átomos do material contido no solo
(Weindorf et al., 2013), tornando possível identificar a química elementar dos solos.
Segundo (Silva et al., 2020a), esta técnica, assim como a ERD, apresenta baixo custo
contidas em uma faixa espectral específica ou nas intensidades emitidas pela EXRF
não contêm informações suficientes para prever todas as propriedades do solo (Ng et
al., 2020b).
interpretação e associação dos resultados com atributos desejados não seja feita de
métodos mais sofisticados (McBratney et al., 2003). Dentro desta evolução, segundo a
do solo é fundir os dados das diferentes faixas de ERD com as intensidades da EXRF.
A “fusão de dados” consiste na união de dados de diversas fontes e pode ser dividida
vez mais popular para fins de estimativa de propriedades do solo (Tabatabai et al.,
caracterização de solos (Andrade et al., 2022; Grunwald et al., 2015; Mancini et al.,
De acordo com (Borràs et al., 2015), o nível mais simples de fusão é o baixo,
escala, utilizando análises como a de componentes principais e, por fim, estes dados
são concatenados em uma única tabela. O terceiro e último nível é o alto, no qual os
fim, os modelos são combinados para, assim, obter-se o melhor modelo final.
dados bastante robusto, e a fusão destes dados só aumenta este volume, gerando
trabalhados são não lineares, com diferentes escalas e de diferentes tipos de fonte.
2001) é uma técnica não paramétrica que foi desenvolvida com o intuito de melhorar
que cada árvore seja treinada em um determinado pacote de dados. Cada árvore
aleatório é usada em cada nó não terminal para aumentar ainda mais a diversidade
Este algoritmo foi apresentado pela primeira vez por (Chen and Guestrin,
2016b) e tem sido amplamente utilizado devido à sua eficiência robusta. O Xgboost
especialmente usado para lidar com dados espaciais (Xu et al., 2022).
qualidade da água (Xu et al., 2022), modelos hidrológicos de bacias (Wang et al.,
2022), meteorologia florestal (Ghafarian et al., 2022), água no solo (Karthikeyan and
Mishra, 2021), modelos de física do solo (Zhang et al., 2021), salinização do solo
(Ma et al., 2021), erosão do solo e da água (Golkarian et al., 2023), carbono do solo
(He et al., 2022; Nguyen et al., 2022b; Zhang et al., 2022), parâmetros produtivos de
culturas agrícolas (Han et al., 2022), metais pesados no solo (Ye et al., 2023; D. Zhao
et al., 2022a), entre outras aplicações, o que tem feito esse algoritmo despontar nos
últimos anos.
espacial podem ser usados para prever solos em locais não visitados, porém,
áreas com poucas observações de solo (Ruhollah et al., 2022a). Em tais situações,
uma abordagem de extrapolação pode ser aplicada para prever os solos na área
alvo (locais sem observações) usando os solos da área de referência (área com
digital do solo, pode ser extrapolado para prever as características do solo da área
observados de uma área de referência para prever solos em uma área alvo (Angelini
Deve-se notar que existem vários desafios que podem afetar as estimativas
solo (Temme and Veldkamp, 2009), entre outros fatores, estão entre os problemas
variabilidade espacial dos atributos do solo, devendo ser considerado no seu manejo
(Gray et al., 2016). Apesar das análises mineralógicas serem essenciais para o
entendimento da dinâmica dos solos tropicais (Costa et al., 2020) estas não são
realizadas de forma rotineira como as de fertilidade, o que pode ser associado à alta
complexidade das análises mineralógicas do solo, o que acaba exigindo maior tempo
químicos (Rosin et al., 2022), fazendo com que a tomada de decisão em campo ainda
seja complexa, baseada na expertise dos profissionais e pouco assertiva (Moral et al.,
profissionais envolvidos.
através da ditionita, neste processo os íons de Fe2+ e Al3+ são reduzidos e liberados
mantém o pH neutro.
(FEO) que induz a formação complexos solúveis entre o oxalato e os íons Al e Fe.
Ao atingir o pH < 3.5, as superfícies de óxidos são protonadas, sendo este o primeiro
Al3+ e Fe3+ (McKeague e Day, 1966). Enquanto o FED mostra os conteúdos de ferros
Ambos permitem uma indicação aos conteúdos totais de óxidos de ferro por métodos
de Fe não ganhou espaço como análise de rotina em laboratórios. O que pode ser
utilizam ácidos, sais e soluções de alta periculosidade. Além disso, ainda são
necessários técnicos que dominem os métodos para realização das análises, longo
tempo para execução e por fim, apresentando alto custo (Mendes et al., 2022a).
1.3 Referências
Abdikan, S., Sekertekin, A., Narin, O.G., Delen, A., Balik Sanli, F., 2022. A comparative
analysis of SLR, MLR, ANN, XGBoost and CNN for crop height estimation of sunflower
using Sentinel-1 and Sentinel-2. Advances in Space Research.
https://doi.org/10.1016/J.ASR.2022.11.046
14
Afshar, F.A., Ayoubi, S., Jafari, A., 2018a. The extrapolation of soil great groups using
multinomial logistic regression at regional scale in arid regions of Iran. Geoderma 315,
36–48. https://doi.org/10.1016/J.GEODERMA.2017.11.030
Afshar, F.A., Ayoubi, S., Jafari, A., 2018b. The extrapolation of soil great groups using
multinomial logistic regression at regional scale in arid regions of Iran. Geoderma 315,
36–48. https://doi.org/10.1016/J.GEODERMA.2017.11.030
Almeida, G.M. de, Pereira, G.T., Bahia, A.S.R. de S., Fernandes, K., Marques Júnior, J.,
2021. Machine learning in the prediction of sugarcane production environments. Comput
Electron Agric 190. https://doi.org/10.1016/j.compag.2021.106452
Almeida, G.M. de, Pereira, G.T., Bahia, A.S.R.D.S., Júnior, J.M., 2020. Aprendizagem de
máquina na predição de ambientes de produção de cana-de-açúcar. Comput Electron
Agric.
Andrade, R., Mancini, M., Teixeira, A.F. dos S., Silva, S.H.G., Weindorf, D.C., Chakraborty,
S., Guilherme, L.R.G., Curi, N., 2022. Proximal sensor data fusion and auxiliary
information for tropical soil property prediction: Soil texture. Geoderma 422, 115936.
https://doi.org/10.1016/J.GEODERMA.2022.115936
Angelini, M.E., Kempen, B., Heuvelink, G.B.M., Temme, A.J.A.M., Ransom, M.D., 2020a.
Extrapolation of a structural equation model for digital soil mapping. Geoderma 367,
114226. https://doi.org/10.1016/J.GEODERMA.2020.114226
Angelini, M.E., Kempen, B., Heuvelink, G.B.M., Temme, A.J.A.M., Ransom, M.D., 2020b.
Extrapolation of a structural equation model for digital soil mapping. Geoderma 367,
114226. https://doi.org/10.1016/J.GEODERMA.2020.114226
Anzanello, M.J., Ortiz, R.S., Limbergerb, R.P., Mayorga, P., 2013. A multivariate-based
wavenumber selection method for classifying medicines into authentic or counterfeit
classes. J Pharm Biomed Anal 83, 209–214. https://doi.org/10.1016/J.JPBA.2013.05.004
Bachmann, C.M., Philpot, W., Abelev, A., Korwan, D., 2014. Phase angle dependence of
sand density observable in hyperspectral reflectance. Remote Sens Environ 150, 53–65.
https://doi.org/10.1016/J.RSE.2014.03.024
Bahia, A.S.R. de S., Marques, J., La Scala, N., Pellegrino Cerri, C.E., Camargo, L.A., 2017a.
Prediction and Mapping of Soil Attributes using Diffuse Reflectance Spectroscopy and
Magnetic Susceptibility. Soil Science Society of America Journal 81, 1450–1462.
https://doi.org/10.2136/sssaj2017.06.0206
Bahia, A.S.R. de S., Marques, J., la Scala, N., Pellegrino Cerri, C.E., Camargo, L.A., 2017b.
Prediction and Mapping of Soil Attributes using Diffuse Reflectance Spectroscopy and
Magnetic Susceptibility. Soil Science Society of America Journal 81, 1450–1462.
https://doi.org/10.2136/sssaj2017.06.0206
Bahia, A.S.R.D.S., Marques, J., Siqueira, D.S., 2015. Procedures using diffuse reflectance
spectroscopy for estimating hematite and goethite in Oxisols of São Paulo, Brazil.
Geoderma Regional 5, 150–156. https://doi.org/10.1016/j.geodrs.2015.04.006
Baldo, D., Marques, J., Fernandes, K., de Almeida, G.M., Siqueira, D.S., 2021a. Soil
mineralogical attributes estimated by color as accessed by proximal sensors and
machine learning. Soil Science Society of America Journal 85, 2185–2200.
https://doi.org/10.1002/saj2.20309
Baldo, D., Marques, J., Fernandes, K., de Almeida, G.M., Siqueira, D.S., 2021b. Soil
mineralogical attributes estimated by color as accessed by proximal sensors and
machine learning. Soil Science Society of America Journal 85, 2185–2200.
https://doi.org/10.1002/saj2.20309
Balsam, W.L., Otto‐Bliesner, B.L., Deaton, B.C., 1995. Modern and Last Glacial Maximum
eolian sedimentation patterns in the Atlantic Ocean interpreted from sediment iron oxide
content. Paleoceanography 10, 493–507. https://doi.org/10.1029/95PA00421
Baseca, C.C., Sendra, S., Lloret, J., Tomas, J., 2019. A smart decision system for digital
farming. Agronomy 9. https://doi.org/10.3390/agronomy9050216
Basu, D., Sinha, R., Sahu, S., Malla, J., Chakravorty, N., Ghosal, P.S., 2022. Identification of
severity and passive measurement of oxidative stress biomarkers for β–thalassemia
patients: K-means, random forest, XGBoost, decision tree, neural network based novel
framework. Advances in Redox Research 5, 100034.
https://doi.org/10.1016/J.ARRES.2022.100034
Bekker, G.F.H. van G., Addison, M., Addison, P., van Niekerk, A., 2019a. Using machine
15
1250. https://doi.org/10.5194/gmd-7-1247-2014
Chen, T., Guestrin, C., 2016a. XGBoost: A scalable tree boosting system, in: Proceedings of
the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.
Association for Computing Machinery, pp. 785–794.
https://doi.org/10.1145/2939672.2939785
Chen, T., Guestrin, C., 2016b. XGBoost: A scalable tree boosting system. Proceedings of the
ACM SIGKDD International Conference on Knowledge Discovery and Data Mining 13-
17-August-2016, 785–794. https://doi.org/10.1145/2939672.2939785
Coblinski, J.A., Giasson, É., Demattê, J.A.M., Dotto, A.C., Costa, J.J.F., Vašát, R., 2020.
Prediction of soil texture classes through different wavelength regions of reflectance
spectroscopy at various soil depths. Catena (Amst) 189, 104485.
https://doi.org/10.1016/j.catena.2020.104485
Cornell, R.M., Schwertmann, U., 2006. The Iron Oxides: Structure, Properties, Reactions,
Occurrences and Uses 707.
da Costa, A.C.S., Junior, I.G. de S., Canton, L.C., Gil, L.G., Figueiredo, R., 2020.
Contribution of the chemical and mineralogical properties of sandy-loam tropical soils to
the cation exchange capacity. Rev Bras Cienc Solo 44, 1–18.
https://doi.org/10.36783/18069657rbcs20200019
de Castro, C.L., Braga, A.P., 2011. Aprendizado supervisionado com conjuntos de dados
desbalanceados. Sba: Controle & Automação Sociedade Brasileira de Automatica 22,
441–466. https://doi.org/10.1590/S0103-17592011000500002
de Motomiya, A.V.A., Corá, J.E., Pereira, G.T., 2006. Uso da krigagem indicatriz na
avaliação de indicadores de fertilidade do solo. Rev Bras Cienc Solo 30, 485–496.
https://doi.org/10.1590/S0100-06832006000300010
Demattê, José Alexandre M, Dotto, A.C., Bedin, L.G., Sayão, V.M., Barros, A., 2019.
Geoderma Soil analytical quality control by traditional and spectroscopy techniques :
Constructing the future of a hybrid laboratory for low environmental impact. Geoderma
337, 111–121. https://doi.org/10.1016/j.geoderma.2018.09.010
Demattê, José A.M., Dotto, A.C., Paiva, A.F.S., Sato, M. V., Dalmolin, R.S.D., de Araújo, M.
do S.B., da Silva, E.B., Nanni, M.R., ten Caten, A., Noronha, N.C., Lacerda, M.P.C., de
Araújo Filho, J.C., Rizzo, R., Bellinaso, H., Francelino, M.R., Schaefer, C.E.G.R.,
Vicente, L.E., dos Santos, U.J., de Sá Barretto Sampaio, E. V., Menezes, R.S.C., de
Souza, J.J.L.L., Abrahão, W.A.P., Coelho, R.M., Grego, C.R., Lani, J.L., Fernandes,
A.R., Gonçalves, D.A.M., Silva, S.H.G., de Menezes, M.D., Curi, N., Couto, E.G., dos
Anjos, L.H.C., Ceddia, M.B., Pinheiro, É.F.M., Grunwald, S., Vasques, G.M., Marques
Júnior, J., da Silva, A.J., Barreto, M.C. de V., Nóbrega, G.N., da Silva, M.Z., de Souza,
S.F., Valladares, G.S., Viana, J.H.M., da Silva Terra, F., Horák-Terra, I., Fiorio, P.R., da
Silva, R.C., Frade Júnior, E.F., Lima, R.H.C., Alba, J.M.F., de Souza Junior, V.S., Brefin,
M.D.L.M.S., Ruivo, M.D.L.P., Ferreira, T.O., Brait, M.A., Caetano, N.R., Bringhenti, I., de
Sousa Mendes, W., Safanelli, J.L., Guimarães, C.C.B., Poppiel, R.R., e Souza, A.B.,
Quesada, C.A., do Couto, H.T.Z., 2019. The Brazilian Soil Spectral Library (BSSL): A
general view, application and challenges. Geoderma 354, 113793.
https://doi.org/10.1016/j.geoderma.2019.05.043
Dietterich, T., 1995. Overfitting and undercomputing in machine learning. ACM Computing
Surveys (CSUR) 27, 326–327. https://doi.org/10.1145/212094.212114
dos Santos, F.R., de Oliveira, J.F., Barbosa, G.M.C., Melquiades, F.L., 2021. Comparison
between energy dispersive X-ray fluorescence spectral data and elemental data for soil
attributes modelling. Spectrochim Acta Part B At Spectrosc 185, 106303.
https://doi.org/10.1016/J.SAB.2021.106303
Eberhardt, D.N., Vendrame, P.R.S., Becquer, T., De Fátima Guimarães, M., 2008a.
Influência da granulometria e da mineralogia sobre a retenção do fósforo em latossolos
sob pastagens no cerrado. Rev Bras Cienc Solo 32, 1009–1016.
https://doi.org/10.1590/s0100-06832008000300010
Eberhardt, D.N., Vendrame, P.R.S., Becquer, T., De Fátima Guimarães, M., 2008b.
Influência da granulometria e da mineralogia sobre a retenção do fósforo em latossolos
sob pastagens no cerrado. Rev Bras Cienc Solo 32, 1009–1016.
https://doi.org/10.1590/s0100-06832008000300010
Ebtehaj, I., Bonakdari, H., 2022. A reliable hybrid outlier robust non-tuned rapid machine
17
learning model for multi-step ahead flood forecasting in Quebec, Canada. J Hydrol
(Amst) 614, 128592. https://doi.org/10.1016/J.JHYDROL.2022.128592
EMBRAPA, 2017. Manual de metodos de análises, in: Manual de Métodos de Análise de
Solo. Brasilia, DF, p. 574.
Esfandiarpour-Boroujeni, I., Shamsabadi, M.S., Shirani, H., Mosleh, Z., Bagheri
Bodaghabadi, M., Salehi, M.H., 2020. Comparison of error and uncertainty of decision
tree and learning vector quantization models for predicting soil classes in areas with low
altitude variations. Catena (Amst) 191, 104581.
https://doi.org/10.1016/J.CATENA.2020.104581
Fan, S.S., Chang, F.H., Hsueh, H.T., Ko, T.H., 2016. Measurement of Total Free Iron in Soils
by H2S Chemisorption and Comparison with the Citrate Bicarbonate Dithionite Method.
J Anal Methods Chem 2016. https://doi.org/10.1155/2016/7213542
Faria, A.J.G. de, Silva, S.H.G., Andrade, R., Mancini, M., Melo, L.C.A., Weindorf, D.C.,
Guilherme, L.R.G., Curi, N., 2022. Prediction of soil organic matter content by combining
data from Nix ProTM color sensor and portable X-ray fluorescence spectrometry in
tropical soils. Geoderma Regional 28, e00461.
https://doi.org/10.1016/J.GEODRS.2021.E00461
Fernandes, L.A., Castro, A.B. de, Basilici, G., 2007. Seismites in continental sand sea
deposits of the Late Cretaceous Caiuá Desert , Bauru Basin, Brasil. Sediment Geol 199,
61–64. https://doi.org/10.1016/j.sedgeo.2005.12.030
Fernandes, R.B.A., Barrón, V., Torrent, J., Fontes, M.P.F., 2004. Quantificação de óxidos de
ferro de Latossolos brasileiros por espectroscopia de refletância difusa. Rev Bras Cienc
Solo 28, 245–257. https://doi.org/10.1590/S0100-06832004000200003
Fink, J.R., Inda, A. v., Bavaresco, J., Barrón, V., Torrent, J., Bayer, C., 2016. Adsorption and
desorption of phosphorus in subtropical soils as affected by management system and
mineralogy. Soil Tillage Res 155, 62–68. https://doi.org/10.1016/J.STILL.2015.07.017
Fonseca, J. da S., Campos, M.C.C., Brito Filho, E.G. de, Mantovanelli, B.C., Silva, L.S., de
Lima, A.F.L., Da Cunha, J.M., Simões, E.L., dos Santos, L.A.C., 2021. Soil–landscape
relationship in a sandstone-gneiss topolithosequence in the State of Amazonas, Brazil.
Environ Earth Sci 80, 1–15. https://doi.org/10.1007/s12665-021-10026-9
Ganaie, M.A., Tanveer, M., Suganthan, P.N., Snasel, V., 2022. Oblique and rotation double
random forest. Neural Networks 153, 496–517.
https://doi.org/10.1016/J.NEUNET.2022.06.012
Ghafarian, F., Wieland, R., Lüttschwager, D., Nendel, C., 2022. Application of extreme
gradient boosting and Shapley Additive explanations to predict temperature regimes
inside forests from standard open-field meteorological data. Environmental Modelling &
Software 156, 105466. https://doi.org/10.1016/J.ENVSOFT.2022.105466
Gholizadeh, A., Luboš, B., Saberioon, M., Vašát, R., 2013. Visible, Near-Infrared, and Mid-
Infrared Spectroscopy Applications for Soil Assessment with Emphasis on Soil Organic
Matter Content and Quality: State-of-the-Art and Key Issues.
http://dx.doi.org/10.1366/13-07288 67, 1349–1362. https://doi.org/10.1366/13-07288
Gholizadeh, A., Saberioon, M., Pouladi, N., Ben-Dor, E., 2023. Quantification and depth
distribution analysis of carbon to nitrogen ratio in forest soils using reflectance
spectroscopy. International Soil and Water Conservation Research 11, 112–124.
https://doi.org/10.1016/J.ISWCR.2022.06.004
Goldshleger, N., Ben-Dor, E., Benyamini, Y., Agassi, M., 2004. SOIL REFLECTANCE AS A
TOOL FOR ASSESSING PHYSICAL CRUST ARRANGEMENT OF FOUR TYPICAL
SOILS IN ISRAEL. Soil Sci 169, 677–687.
https://doi.org/10.1097/01.ss.0000146024.61559.e2
Golkarian, A., Khosravi, K., Panahi, M., Clague, J.J., 2023. Spatial variability of soil water
erosion: Comparing empirical and intelligent techniques. Geoscience Frontiers 14,
101456. https://doi.org/10.1016/J.GSF.2022.101456
Gómez-Escalonilla, Diancoumba, O., Traoré, D.Y., Montero, E., Martín-Loeches, M.,
Martínez-Santos, P., 2022. Multiclass spatial predictions of borehole yield in southern
Mali by means of machine learning classifiers. J Hydrol Reg Stud 44, 101245.
https://doi.org/10.1016/J.EJRH.2022.101245
Gray, J.M., Bishop, T.F.A., Wilford, J.R., 2016. Lithology and soil relationships for soil
modelling and mapping. Catena (Amst) 147, 429–440.
18
https://doi.org/10.1016/j.catena.2016.07.045
Grunwald, S., Vasques, G.M., Rivero, R.G., 2015. Fusion of Soil and Remote Sensing Data
to Model Soil Properties. Advances in Agronomy 131, 1–109.
https://doi.org/10.1016/BS.AGRON.2014.12.004
Hall, D.L., Llinas, J., 2016. An introduction to multi-sensor data fusion. Sensors,
Nanoscience, Biomedical Engineering, and Instruments 85.
Han, L., Yang, G., Yang, X., Song, X., Xu, B., Li, Z., Wu, Jintao, Yang, H., Wu, Jianwei, 2022.
An explainable XGBoost model improved by SMOTE-ENN technique for maize lodging
detection based on multi-source unmanned aerial vehicle images. Comput Electron
Agric 194, 106804. https://doi.org/10.1016/J.COMPAG.2022.106804
He, M., Tang, L., Li, C., Ren, J., Zhang, L., Li, X., 2022. Dynamics of soil organic carbon and
nitrogen and their relations to hydrothermal variability in dryland. J Environ Manage 319,
115751. https://doi.org/10.1016/J.JENVMAN.2022.115751
Heuvelink, G.B.M., Brus, D.J., Rossiter, D.G., Shi, Z., 2019. Editorial for pedometrics 2017
special issue. Eur J Soil Sci 70, 25–26. https://doi.org/10.1111/ejss.12772
Hikouei, I.S., Kim, S.S., Mishra, D.R., 2021. Machine-learning classification of soil bulk
density in salt marsh environments. Sensors 21. https://doi.org/10.3390/s21134408
Holmgren, G.G.S., 1967a. A Rapid Citrate-Dithionite Extractable Iron Procedure. Soil
Science Society of America Journal 31, 210–211.
https://doi.org/10.2136/sssaj1967.03615995003100020020x
Holmgren, G.G.S., 1967b. A Rapid Citrate-Dithionite Extractable Iron Procedure. Soil
Science Society of America Journal 31, 210–211.
https://doi.org/10.2136/sssaj1967.03615995003100020020x
Hong, H., Ji, K., Hei, H., Wang, C., Liu, C., Zhao, L., Lanson, B., Zhao, C., Fang, Q., Algeo,
T.J., 2023. Clay mineral evolution and formation of intermediate phases during
pedogenesis on picrite basalt bedrock under temperate conditions (Yunnan,
southwestern China). Catena (Amst) 220, 106677.
https://doi.org/10.1016/J.CATENA.2022.106677
Isaaks, E.H., Srivastava, R.M., 1989. An Introduction to Applied Geostatistics, Computers &
Geosciences. Pergamon. https://doi.org/10.1016/0098-3004(91)90055-I
Jararweh, Y., Fatima, S., Jarrah, M., AlZu’bi, S., 2023. Smart and sustainable agriculture:
Fundamentals, enabling technologies, and future directions. Computers and Electrical
Engineering 110, 108799. https://doi.org/10.1016/j.compeleceng.2023.108799
Jha, K., Doshi, A., Patel, P., Shah, M., 2019. A comprehensive review on automation in
agriculture using artificial intelligence. Artificial Intelligence in Agriculture 2, 1–12.
https://doi.org/10.1016/J.AIIA.2019.05.004
Kampf, N., Schwertmann, U., 1982. The 5-M-NaOH concentration treatment for iron oxides in
soils. Clays Clay Miner 30, 401–408.
https://doi.org/10.1346/CCMN.1982.0300601/METRICS
Karthikeyan, L., Mishra, A.K., 2021. Multi-layer high-resolution soil moisture estimation using
machine learning over the United States. Remote Sens Environ 266, 112706.
https://doi.org/10.1016/J.RSE.2021.112706
Karunasingha, D.S.K., 2022. Root mean square error or mean absolute error? Use their ratio
as well. Inf Sci (N Y) 585, 609–629. https://doi.org/10.1016/J.INS.2021.11.036
Kaya, F., Başayiğit, L., Keshavarzi, A., Francaviglia, R., 2022. Digital mapping for soil texture
class prediction in northwestern Türkiye by different machine learning algorithms.
Geoderma Regional 31, e00584. https://doi.org/10.1016/J.GEODRS.2022.E00584
Ker, J.C., 1997. LATOSSOLOS DO BRASIL: UMA REVISÃO. Geonomos 5, 17–40.
https://doi.org/10.18285/GEONOMOS.V5I1.187
Ker, J.C., Curi, N., Schaefer, C.E., Torrado, P.V., 2012. Pedologia: fundamentos. Viçosa.
Kiangala, S.K., Wang, Z., 2021. An effective adaptive customization framework for small
manufacturing plants using extreme gradient boosting-XGBoost and random forest
ensemble learning algorithms in an Industry 4.0 environment. Machine Learning with
Applications 4, 100024. https://doi.org/10.1016/J.MLWA.2021.100024
Kragt, M.E., Pannell, D.J., Robertson, M.J., Thamo, T., 2012. Assessing costs of soil carbon
sequestration by crop-livestock farmers in Western Australia. Agric Syst 112, 27–37.
https://doi.org/10.1016/j.agsy.2012.06.005
Kuncheva, L.I., Matthews, C.E., Arnaiz-González, Á., Rodríguez, J.J., 2020. Feature
19
Selection from High-Dimensional Data with Very Low Sample Size: A Cautionary Tale.
Lark, R.M., 2000. Designing sampling grids from imprecise information on soil variability, an
approach based on the fuzzy kriging variance. Geoderma 98, 35–59.
https://doi.org/10.1016/S0016-7061(00)00051-3
Lee, M.E., Jeon, E.K., Tsang, D.C.W., Baek, K., 2018. Simultaneous application of oxalic
acid and dithionite for enhanced extraction of arsenic bound to amorphous and
crystalline iron oxides. J Hazard Mater 354, 91–98.
https://doi.org/10.1016/J.JHAZMAT.2018.04.083
Liu, J. cheng, He, H. ping, Michalski, J., Cuadros, J., Yao, Y. zeng, Tan, W., Qin, X. rong, Li,
S. ying, Wei, G. jian, 2021. Reflectance spectroscopy applied to clay mineralogy and
alteration intensity of a thick basaltic weathering sequence in Hainan Island, South
China. Appl Clay Sci 201, 105923. https://doi.org/10.1016/J.CLAY.2020.105923
Liu, J., Yang, K., Tariq, A., Lu, L., Soufan, W., El Sabagh, A., 2023. Interaction of climate,
topography and soil properties with cropland and cropping pattern using remote sensing
data and machine learning methods. Egyptian Journal of Remote Sensing and Space
Science 26, 415–426. https://doi.org/10.1016/j.ejrs.2023.05.005
Liu, Q., He, L., Guo, L., Wang, M., Deng, D., Lv, P., Wang, R., Jia, Z., Hu, Z., Wu, G., Shi, T.,
2022. Digital mapping of soil organic carbon density using newly developed bare soil
spectral indices and deep neural network. Catena (Amst) 219, 106603.
https://doi.org/10.1016/J.CATENA.2022.106603
Liu, X., Zhu, A.X., Yang, L., Pei, T., Liu, J., Zeng, C., Wang, D., 2020. A graded proportion
method of training sample selection for updating conventional soil maps. Geoderma
357, 113939. https://doi.org/10.1016/j.geoderma.2019.113939
Lorz, C., Fruhauf, M., Mailander, R., Phillips, J.D., Kleber, A., 2013. Influence of Cover Beds
on Soils, Mid-Latitude Slope Deposits (Cover Beds).
Lu, W.N., He, Y., Wang (王阳), Y., Ke, S., 2020. Behavior of calcium isotopes during
continental subduction recorded in meta-basaltic rocks. Geochim Cosmochim Acta 278,
392–404. https://doi.org/10.1016/J.GCA.2019.09.027
Ma, G., Ding, J., Han, L., Zhang, Z., Ran, S., 2021. Digital mapping of soil salinization based
on Sentinel-1 and Sentinel-2 data combined with machine learning algorithms. Regional
Sustainability 2, 177–188. https://doi.org/10.1016/J.REGSUS.2021.06.001
Malone, B.P., Jha, S.K., Minasny, B., McBratney, A.B., 2016. Comparing regression-based
digital soil mapping and multiple-point geostatistics for the spatial extrapolation of soil
data. Geoderma 262, 243–253. https://doi.org/10.1016/J.GEODERMA.2015.08.037
Mancini, M., Andrade, R., Teixeira, A.F. dos S., Silva, S.H.G., Weindorf, D.C., Chakraborty,
S., Guilherme, L.R.G., Curi, N., 2022. Proximal sensor data fusion for Brazilian soil
properties prediction: Exchangeable/available macronutrients, aluminum, and potential
acidity. Geoderma Regional 30, e00573.
https://doi.org/10.1016/J.GEODRS.2022.E00573
Marques, J., Siqueira, D.S., Camargo, L.A., Teixeira, D.D.B., Barrón, V., Torrent, J., 2014.
Magnetic susceptibility and diffuse reflectance spectroscopy to characterize the spatial
variability of soil properties in a brazilian haplustalf. Geoderma 219–220, 63–71.
https://doi.org/10.1016/j.geoderma.2013.12.007
Maurya, A.K., Bhargava, N., Singh, D., 2022a. Efficient selection of SAR features using ML
based algorithms for accurate FVC estimation. Advances in Space Research 70, 1795–
1809. https://doi.org/10.1016/J.ASR.2022.06.039
Maurya, A.K., Bhargava, N., Singh, D., 2022b. Efficient selection of SAR features using ML
based algorithms for accurate FVC estimation. Advances in Space Research 70, 1795–
1809. https://doi.org/10.1016/J.ASR.2022.06.039
McBratney, A., Gruijter, J., Bryce, A., 2019. Pedometrics timeline. Geoderma 338, 568–575.
https://doi.org/10.1016/j.geoderma.2018.11.048
McBratney, A.B., Mendonça Santos, M.L., Minasny, B., 2003. On digital soil mapping,
Geoderma. https://doi.org/10.1016/S0016-7061(03)00223-4
McKeague, J.A., Day, J.H., 1966. DITHIONITE- AND OXALATE-EXTRACTABLE Fe AND Al
AS AIDS IN DIFFERENTIATING VARIOUS CLASSES OF SOILS. Can J Soil Sci 46, 13–
22. https://doi.org/10.4141/cjss66-003
Mehra, O.P., Jackson, M.L., 1958. Iron Oxide Removal from Soils and Clays by a Dithionite-
Citrate System Buffered with Sodium Bicarbonate. Clays and Clay Minerals 1958 7:1 7,
20
317–327. https://doi.org/10.1346/CCMN.1958.0070122
Mello, F.A.O., Bellinaso, H., Mello, D.C., Safanelli, J.L., Mendes, W.D.S., Amorim, M.T.A.,
Gomez, A.M.R., Poppiel, R.R., Silvero, N.E.Q., Gholizadeh, A., Silva, S.H.G., Curi, N.,
Demattê, J.A.M., 2021. Soil parent material prediction through satellite multispectral
analysis on a regional scale at the Western Paulista Plateau, Brazil. Geoderma Regional
26, e00412. https://doi.org/10.1016/J.GEODRS.2021.E00412
Mendes, W. de S., Demattê, J.A.M., Bonfatti, B.R., Resende, M.E.B., Campos, L.R., Costa,
A.C.S. da, 2021. A novel framework to estimate soil mineralogy using soil spectroscopy.
Applied Geochemistry 127, 104909.
https://doi.org/10.1016/J.APGEOCHEM.2021.104909
Mendes, W. de S., Demattê, J.A.M., Minasny, B., Silvero, N.E.Q., Bonfatti, B.R., Safanelli,
J.L., Rizzo, R., Costa, A.C.S. da, 2022a. Free iron oxide content in tropical soils
predicted by integrative digital mapping. Soil Tillage Res 219.
https://doi.org/10.1016/j.still.2022.105346
Mendes, W. de S., Demattê, J.A.M., Minasny, B., Silvero, N.E.Q., Bonfatti, B.R., Safanelli,
J.L., Rizzo, R., Costa, A.C.S. da, 2022b. Free iron oxide content in tropical soils
predicted by integrative digital mapping. Soil Tillage Res 219, 105346.
https://doi.org/10.1016/J.STILL.2022.105346
Merl, T., Rasmussen, M.R., Koch, L.R., Søndergaard, J.V., Bust, F.F., Koren, K., 2022.
Measuring soil pH at in situ like conditions using optical pH sensors (pH-optodes). Soil
Biol Biochem 175, 108862. https://doi.org/10.1016/J.SOILBIO.2022.108862
Minasny, B., Hartemink, A.E., 2011a. Predicting soil properties in the tropics. Earth Sci Rev
106, 52–62. https://doi.org/10.1016/j.earscirev.2011.01.005
Minasny, B., Hartemink, A.E., 2011b. Predicting soil properties in the tropics. Earth Sci Rev
106, 52–62. https://doi.org/10.1016/j.earscirev.2011.01.005
Minasny, B., McBratney, A.B., 2016. Digital soil mapping: A brief history and some lessons.
Geoderma 264, 301–311. https://doi.org/10.1016/j.geoderma.2015.07.017
Moral, F.J., Rebollo, F.J., Campillo, C., Serrano, J.M., 2019a. Using an objective and
probabilistic model to delineate homogeneous zones in hedgerow olive orchards. Soil
Tillage Res 194, 104308. https://doi.org/10.1016/j.still.2019.104308
Moral, F.J., Rebollo, F.J., Campillo, C., Serrano, J.M., 2019b. Using an objective and
probabilistic model to delineate homogeneous zones in hedgerow olive orchards. Soil
Tillage Res 194. https://doi.org/10.1016/j.still.2019.104308
Naimi, S., Ayoubi, S., di Raimo, L.A.D.L., Dematte, J.A.M., 2022. Quantification of some
intrinsic soil properties using proximal sensing in arid lands: Application of Vis-NIR, MIR,
and pXRF spectroscopy. Geoderma Regional 28, e00484.
https://doi.org/10.1016/J.GEODRS.2022.E00484
Nawar, S., Delbecque, N., Declercq, Y., Smedt, P. De, Finke, P., Verdoodt, A., Meirvenne, M.
Van, Mouazen, A.M., 2019. Geoderma Can spectral analyses improve measurement of
key soil fertility parameters with X-ray fl uorescence spectrometry ? Geoderma 350, 29–
39. https://doi.org/10.1016/j.geoderma.2019.05.002
Nawar, S., Richard, F., Kassim, A.M., Tekin, Y., Mouazen, A.M., 2022. Fusion of Gamma-
rays and portable X-ray fluorescence spectral data to measure extractable potassium in
soils. Soil Tillage Res 223, 105472. https://doi.org/10.1016/J.STILL.2022.105472
Ng, W., Minasny, B., McBratney, A., 2020a. Convolutional neural network for soil microplastic
contamination screening using infrared spectroscopy. Science of the Total Environment
702, 134723. https://doi.org/10.1016/j.scitotenv.2019.134723
Ng, W., Minasny, B., Mcbratney, A., 2020b. Science of the Total Environment Convolutional
neural network for soil microplastic contamination screening using infrared
spectroscopy. Science of the Total Environment 702, 134723.
https://doi.org/10.1016/j.scitotenv.2019.134723
Ng, W., Minasny, B., Montazerolghaem, M., Padarian, J., Ferguson, R., Bailey, S.,
McBratney, A.B., 2019. Convolutional neural network for simultaneous prediction of
several soil properties using visible/near-infrared, mid-infrared, and their combined
spectra. Geoderma 352, 251–267. https://doi.org/10.1016/j.geoderma.2019.06.016
Nguyen, T.T., Pham, T.D., Nguyen, C.T., Delfos, J., Archibald, R., Dang, K.B., Hoang, N.B.,
Guo, W., Ngo, H.H., 2022a. A novel intelligence approach based active and ensemble
learning for agricultural soil organic carbon prediction using multispectral and SAR data
21
Soriano-Disla, J.M., Janik, L.J., Viscarra Rossel, R.A., MacDonald, L.M., McLaughlin, M.J.,
2014. The performance of visible, near-, and mid-infrared reflectance spectroscopy for
prediction of soil physical, chemical, and biological properties. Appl Spectrosc Rev 49,
139–186. https://doi.org/10.1080/05704928.2013.811081
Sothe, C., Almeida, C.M. De, Schimalski, M.B., Liesenberg, V., Rosa, L.E.C. La, Castro,
J.D.B., Feitosa, R.Q., 2019. A comparison of machine and deep-learning algorithms
applied to multisource data for a subtropical forest area classification. https://doi-
org.ez87.periodicos.capes.gov.br/10.1080/01431161.2019.1681600.
https://doi.org/10.1080/01431161.2019.1681600
Sothe, C., de Almeida, C.M., Schimalski, M.B., Liesenberg, V., la Rosa, L.E.C., Castro,
J.D.B., Feitosa, R.Q., 2020. A comparison of machine and deep-learning algorithms
applied to multisource data for a subtropical forest area classification. Int J Remote Sens
41, 1943–1969. https://doi.org/10.1080/01431161.2019.1681600
Souza, E.D., Carneiro, M.A.C., Paulino, H.B., 2005. Atributos físicos de um Neossolo
Quartzarênico e um Latossolo Vermelho sob diferentes sistemas de manejo. Pesqui
Agropecu Bras 40, 1135–1139. https://doi.org/10.1590/S0100-204X2005001100012
Stranghoener, M., Dultz, S., Behrens, H., Schippers, A., 2020. Potential mobilizable Fe from
secondary phases of differentially altered subsurface basaltic rock– a sequential
extraction study on ICDP site Hawaii. Applied Geochemistry 121, 104705.
https://doi.org/10.1016/J.APGEOCHEM.2020.104705
Suits, D.B., 1957. Use of Dummy Variables in Regression Equations. J Am Stat Assoc 52,
548. https://doi.org/10.2307/2281705
Sumathi, K., 2018. Data Analytics platform for intelligent agriculture. 2018 2nd International
Conference on I-SMAC (IoT in Social, Mobile, Analytics and Cloud) (I-SMAC)I-SMAC
(IoT in Social, Mobile, Analytics and Cloud) (I-SMAC), 2018 2nd International
Conference on 647–650. https://doi.org/10.1109/I-SMAC.2018.8653740
Sun, Z., Wang, J., Wang, Y., Long, L., Luo, Z., Deng, X., Hu, Q., Wang, M., 2020. Sodium-
rich volcanic rocks and their relationships with iron deposits in the Aqishan–Yamansu
belt of Eastern Tianshan, NW China. Geoscience Frontiers 11, 697–713.
https://doi.org/10.1016/J.GSF.2019.06.011
Swetha, R.K., Dasgupta, S., Chakraborty, S., Li, B., Weindorf, D.C., Mancini, M., Silva,
S.H.G., Ribeiro, B.T., Curi, N., Ray, D.P., 2022. Using Nix color sensor and Munsell soil
color variables to classify contrasting soil types and predict soil organic carbon in
Eastern India. Comput Electron Agric 199, 107192.
https://doi.org/10.1016/J.COMPAG.2022.107192
Tabatabai, S., Knadel, M., Thomsen, A., Greve, M.H., 2019. On-the-Go Sensor Fusion for
Prediction of Clay and Organic Carbon Using Pre-processing Survey, Different
Validation Methods, and Variable Selection. Soil Science Society of America Journal 83,
300–310. https://doi.org/10.2136/SSSAJ2018.10.0377
Takoutsing, B., Heuvelink, G.B.M., 2022. Comparing the prediction performance, uncertainty
quantification and extrapolation potential of regression kriging and random forest while
accounting for soil measurement errors. Geoderma 428, 116192.
https://doi.org/10.1016/J.GEODERMA.2022.116192
Teixeira, A.F. dos S., Andrade, R., Mancini, M., Silva, S.H.G., Weindorf, D.C., Chakraborty,
S., Guilherme, L.R.G., Curi, N., 2022. Proximal sensor data fusion for tropical soil
property prediction: Soil fertility properties. J South Am Earth Sci 116, 103873.
https://doi.org/10.1016/J.JSAMES.2022.103873
Teixeira, A.F. dos S., Henrique Procópio Pelegrino, M., Missina Faria, W., Henrique Godinho
Silva, S., Gabriela Marcolino Gonçalves, M., Weimar Acerbi Júnior, F., Rezende
Gomide, L., Linares Pádua Júnior, A., de Souza, I.A., Chakraborty, S., Weindorf, D.C.,
Roberto Guimarães Guilherme, L., Curi, N., 2020. Tropical soil pH and sorption complex
prediction via portable X-ray fluorescence spectrometry. Geoderma 361, 114132.
https://doi.org/10.1016/j.geoderma.2019.114132
Teixeira, R.S., Vendrame, P.R.S., Christoni, A.R.F., SILVA, P.R.C., 2016. QUÍMICA E
MINERALOGIA DE UM SOLO DESENVOLVIDO DE BASALTO, COLETADO
ATRAVÉS DE SONDAGEM SPT. Boletim de Geografia 34, 116–126.
https://doi.org/10.4025/bolgeogr.v34i2.28948
Temme, A.J.A.M., Veldkamp, A., 2009. Multi-process Late Quaternary landscape evolution
24
modelling reveals lags in climate response over small spatial scales. Earth Surf Process
Landf 34, 573–589. https://doi.org/10.1002/ESP.1758
ten Caten, A., Dalmolin, R.S.D., Pedron, F. de A., Santos, M. de L.M., 2011a. Extrapolação
das relações solo-paisagem a partir de uma área de referência. Ciência Rural 41, 812–
816. https://doi.org/10.1590/S0103-84782011000500012
ten Caten, A., Dalmolin, R.S.D., Pedron, F. de A., Santos, M. de L.M., 2011b. Extrapolação
das relações solo-paisagem a partir de uma área de referência. Ciência Rural 41, 812–
816. https://doi.org/10.1590/S0103-84782011000500012
Thompson, J.A., Roecker, S., Grunwald, S., Owens, P.R., 2012. Digital Soil Mapping:
Interactions with and Applications for Hydropedology, in: Hydropedology. Elsevier, pp.
665–709. https://doi.org/10.1016/B978-0-12-386941-8.00021-6
Thornthwaite, C.W., 1948. An Approach toward a Rational Classification of Climate Author ( s
): C . W . Thornthwaite Published by : American Geographical Society Stable URL :
http://www.jstor.org/stable/210739 Accessed : 11-08-2016 18 : 02 UTC. Geogr Rev 38,
55–94. https://doi.org/10.2307/210739
Tsakiridis, N.L., Keramaris, K.D., Theocharis, J.B., Zalidis, G.C., 2020. Simultaneous
prediction of soil properties from VNIR-SWIR spectra using a localized multi-channel 1-
D convolutional neural network. Geoderma 367.
https://doi.org/10.1016/j.geoderma.2020.114208
Vasques, G.M., Rodrigues, H.M., Coelho, M.R., Baca, J.F.M., Dart, R.O., Oliveira, R.P.,
Teixeira, W.G., Ceddia, M.B., 2020. Field Proximal Soil Sensor Fusion for Improving
High-Resolution Soil Property Maps. Soil Systems 2020, Vol. 4, Page 52 4, 52.
https://doi.org/10.3390/SOILSYSTEMS4030052
Vieira, S.R., 2000. Geoestatística em estudos de variabilidade espacial do solo. , in: R.F.
Novais, V.H.A.G.R.S. (Ed.), Tópicos Em Ciência Do Solo. Viçosa, pp. 1–54.
Wang, J.H., Jiang, J.H., Yu, R.Q., 1996. Robust back propagation algorithm as a
chemometric tool to prevent the overfitting to outliers. Chemometrics and Intelligent
Laboratory Systems 34, 109–115. https://doi.org/10.1016/0169-7439(96)00005-6
Wang, S., Peng, H., Hu, Q., Jiang, M., 2022. Analysis of runoff generation driving factors
based on hydrological model and interpretable machine learning method. J Hydrol Reg
Stud 42, 101139. https://doi.org/10.1016/J.EJRH.2022.101139
Weindorf, D.C., Bakr, N., Zhu, Y., 2014a. Advances in portable X-ray fluorescence (PXRF)
for environmental, pedological, and agronomic applications, Advances in Agronomy.
Elsevier. https://doi.org/10.1016/B978-0-12-802139-2.00001-9
Weindorf, D.C., Bakr, N., Zhu, Y., 2014b. Advances in portable X-ray fluorescence (PXRF)
for environmental, pedological, and agronomic applications, in: Advances in Agronomy.
Academic Press Inc., pp. 1–45. https://doi.org/10.1016/B978-0-12-802139-2.00001-9
Weindorf, D.C., Paulette, L., Man, T., 2013. In-situ assessment of metal contamination via
portable X-ray fluorescence spectroscopy: Zlatna, Romania. Environmental Pollution
182, 92–100. https://doi.org/10.1016/j.envpol.2013.07.008
Whittig, L.D., 1965. X-Ray Diffraction Techniques for Mineral Identification and Mineralogical
Composition. Methods of Soil Analysis, Part 1: Physical and Mineralogical Properties,
Including Statistics of Measurement and Sampling 671–698.
https://doi.org/10.2134/AGRONMONOGR9.1.C49
Xu, D., Chen, S., Xu, H., Wang, N., Zhou, Y., Shi, Z., 2020. Data fusion for the measurement
of potentially toxic elements in soil using portable spectrometers. Environmental
Pollution 263, 114649. https://doi.org/10.1016/J.ENVPOL.2020.114649
Xu, D., Zhao, R., Li, S., Chen, S., Jiang, Q., Zhou, L., Shi, Z., 2019. Multi-sensor fusion for
the determination of several soil properties in the Yangtze River Delta, China. Eur J Soil
Sci 70, 162–173. https://doi.org/10.1111/EJSS.12729
Xu, G., Fan, H., Oliver, D.M., Dai, Y., Li, H., Shi, Y., Long, H., Xiong, K., Zhao, Z., 2022.
Decoding river pollution trends and their landscape determinants in an ecologically
fragile karst basin using a machine learning model. Environ Res 214, 113843.
https://doi.org/10.1016/J.ENVRES.2022.113843
Xu, S., Zhao, Y., Wang, M., Shi, X., 2018. Quantification of Different Forms of Iron from Intact
Soil Cores of Paddy Fields with Vis-NIR Spectroscopy. Soil Science Society of America
Journal 82, 1497–1511. https://doi.org/10.2136/SSSAJ2018.01.0014
Yan, F., Shangguan, W., Zhang, J., Hu, B., 2020a. Depth-to-bedrock map of China at a
25
2.1 Introdução
e Hartemink, 2011b).
solos são óxi-hidróxidos de alumínio e ferro, como a gibbsita (Gb), hematita (Hm),
(Baldo et al., 2021a) esses óxidos apresentam diversas constituições e formas, além
de raios X (DRX) que avalia a estrutura dos cristais no solo (Whittig, 1965), extração
ditionita, onde íons de Fe2+ e Al3+ são reduzidos e liberados em solução (Holmgren,
os métodos para realização das análises, longo tempo para execução, alta
periculosidade e por fim, apresentando alto custo (Mendes et al., 2022a). Por
custo e de fácil acesso, como o uso de sensores. A associação de dados obtidos por
aplicadas com sucesso em várias subáreas da ciência do solo (Bahia et al., 2017b,
2015; Marques et al., 2014; Silva et al., 2020b; Silvero et al., 2019; Weindorf et al.,
e físicos como a textura, e químicos (pH, CTC, entre outros), pela fusão dos sensores
(Padarian et al., 2019; Tsakiridis et al., 2020) ou pelo uso destes de forma individual
(Almeida et al., 2021; Bahia et al., 2017b, 2015; Baldo et al., 2021a; Silva et al.,
2020b).
O que há em comum nos dados obtidos a partir desses três sensores (SMBx,
destaque neste âmbito (Almeida et al., 2021). Estas técnicas permitem modelar as
relações não lineares dos dados, algo que os métodos estatísticos tradicionais
Guestrin, 2016). Seu design reduz com sucesso a complexidade da estrutura de uma
o objetivo deste trabalho foi estimar atributos mineralógicos (FED e FEO), utilizando
produção nacional de etanol, açúcar e citros e já vem sendo estudada por vários
Caiuá composto pelas Formações Santo Anastácio e Rio Paraná no estado de São
de dunas do sand sea (Deserto Caiuá) que se estende para região norte do estado
Peixe, Araçatuba, São José do Rio Preto, Presidente Prudente e Marília (Fernandes
31
com inverno seco predominante no norte e noroeste, o clima temperado úmido, com
verão quente, prevalecendo no sul e o clima temperado úmido com inverno seco e
(Figura 1a). O total de 359 amostras de solo foram coletadas em áreas preservadas
1986).
uma solução de NaOH 0,1 mol L-1 como dispersante químico e agitação mecânica
(EMBRAPA, 2017).
2.2.4 Sensores
amostra individual (3,0 × 0,5 cm). Efetuou-se em cada amostra uma varredura de
33
1 (C1) 15 kV, que efetua a leitura das vibrações que indicam a presença de sódio a
leitura das vibrações que indicam a presença de titânio a urânio, por 200s e 250s,
respectivamente.
frequência (0,47 kHz) e foi gerado o total de uma variável por amostra de solo.
Os dados gerados pelos três sensores: ERD (VIS e NIR), EXRF (C1 e C2) e
predições e encontrar, assim, a combinação que gera resultados mais precisos nas
presente trabalho foram testados dois níveis de fusão: a de nível baixo (LLF), que
consiste na concatenação dos dados gerados pelas três fontes em um único banco
diferentes variáveis geradas por cada um dos três sensores. Neste nível foi gerado
O segundo nível testado foi o nível médio (MLF) que consiste inicialmente na
Para este nível foram gerados 17 bancos de dados, sendo 5 com os sensores
descritiva dos atributos do solo (textura, FED e FEO) e para viabilizar o entendimento
realizada foi a de nível baixo onde as variáveis foram concatenas em um único banco
exige uma pré-seleção das variáveis mais relevantes para os atributos de forma
sensores.
Para a seleção dos atributos mais relevantes de cada sensor, os dados foram
C1- Corrente 1 de 15 kV; C2 - Corrente 2 de 50 Kv; VIS – reflectância na faixa do visível; NIR -
reflectância infravermelho próximo; SBMx –suceptibilidade magnética, FRX – fluorescência de raio x.
cada atributo mineralógico. Para entender como essas variáveis geradas pelos
Na etapa seguinte deu-se início a predição dos atributos FED e FEO utilizando
al., 2022). Ela consiste em uma variação dos algoritmos de árvore de decisão, com
a técnica de aumento de gradiente que atua ajustando as funções de perda que são
37
regressão. O algoritmo foi aplicado nos dezessete bancos de dados gerados a partir
da fusão. Todos os bancos de dados foram divididos em 60% para treino e 40% para
erro médio (RMSE). Por fim para avaliarmos o desempenho do modelo no espaço,
selecionado com base nas métricas a citadas acima, foram interpolados através do
variabilidade dos dados entre os pontos máximos e mínimos e tal fato pode ser
estudo.
Figura 3. Gráficos do tipo violino para caracterização dos teores dos atributos dos
que pode ter sido influenciado devido serem rochas enriquecidas em Fe (até 15%
úmidas, altas precipitações e solos com baixo teor de ferro, como os arenitos,
40
secas, baixa precipitação, solos ricos em ferro, como o basalto, além de pH neutro e
Schwertmann, 1982).
fusão dos dados obtidos por meio dos sensores ERD, EFRX e SMBx.
No presente trabalho foram testados dois níveis de fusão, o nível médio exige
uma pré-seleção das variáveis mais relevantes, utilizando o algoritmo Stepwise para
de variáveis para a sua estimativa, tal fato pode ser atribuído às características de
sua formação que são muito especificas. Logo, são necessárias mais variáveis
dependentes para capturar as nuances do atributo, uma vez que pode haver grande
infravermelho.
Pontos coletados
VIS como para NIR. Porém, na figura 5a (FED-VIS) podemos destacar a ocorrência
onde ocorreu a separação dos comprimentos de onda nos intervalos 366 – 462 nm,
que são mais associados às cores roxo e azul, e no intervalo 611 – 837 nm, que
al., 2022).
Diante de tudo que foi observado nos mapas de calor de VIS e NIR, nota-se
“c” (FED-C1) e “d” (FED-C2) é possível observar que o cluster também dividiu os
picos de energia em dois grandes grupos, onde um deles apresenta correlação direta
com os teores de FED e o outro correlação inversa, ou seja, à medida que o teor de
FED aumenta a energia desses pontos diminuem. Os picos de energia que estão
teores de FED. Segundo a literatura, dois picos de ferro são detectados pela
Na figura 5c (FED-C1) foi observado que os picos de 3.0 a 3.5 Kev também
manifestaram relação direta com o FED, mesmo que menos intensa que a citada
43
plagioclásios com alto teor de cálcio serem minerais muito comuns (Lu et al., 2020;
Sun et al., 2020). Os pontos que apresentaram relação mais inversa com FED estão
localizados entre 1.7 e 2.0 Kev, nesses pontos é comumente detectado silício (dos
associados ao roxo e o azul reflete menos e nos solos com maior teor de FEO,
e laranja, devido à maior quantidade de óxidos de ferro que conferem essa cor aos
solos oriundos de basalto, como ferridrita, hematita e goethita (Santos et al., 2021;
Pontos Coletados
Comprimentos de onda selecionados pela stepwise
inversa mais intensa o que pode ser associado a conhecida ocorrência de dois picos
de ferro neste ponto da curva (Santos et al., 2021; Nawar et al., 2022).
métricas foram os que utilizaram somente a SMBx como variável preditora, tanto
selecionados pela Stepwise, ficando com R² 0,01 e 0,14 pontos acima dos modelos
amplitude de MAE e RMSE dos modelos que utilizaram os dados sem nenhuma
limpeza prévia, foram sempre superiores aos modelos que utilizaram os dados
melhor modelo de predição, uma vez que são indicadores complementares e não
(Karunasingha, 2022).
46
1 Tabela 3. Métricas de avaliação dos modelos preditivos de FED e FEO em função da fonte de dados de Espectroscopia de Reflectância
2 Difusa (ERD), Espectroscopia de Fluorescência de raios X (EFRX) e Suscetibilidade magnética em baixa frequência (SMBx)
3
Treino Teste Treino Teste
Sensores R² MAE RMSE R² MAE RMSE R² MAE RMSE R² MAE RMSE
FED FEO
VIS 0,86 3,21 4,76 0,69 5,8 8,32 0,87 0,12 0,35 0,7 0,49 0,74
NIR 0,76 4,54 6,28 0,7 8,19 5,57 0,76 0,32 0,47 0,68 0,47 0,77
C1 0,91 2,73 3,85 0,8 3,96 6,74 0,87 0,24 0,35 0,8 0,36 0,8
C2 0,88 2,88 3,68 0,78 3,98 6,71 0,86 0,25 0,36 0,76 0,29 0,46
SBMx 0,28 8,71 11,94 0,16 8,71 12,37 0,25 0,58 0,84 0,2 0,79 1,15
VIS+NIR 0,80 4,11 5,78 0,73 5,35 7,74 0,79 0,29 0,45 0,71 0,45 0,72
VIS + C1 0,90 2,89 3,91 0,82 3,89 6,33 0,81 0,27 0,43 0,75 0,35 0,81
VIS + C2 0,90 2,98 4,1 0,78 4,1 6,95 0,91 0,16 0,28 0,84 0,2 0,38
VIS + SBMx 0,78 4,28 6,03 0,66 6,35 8,47 0,76 0,31 0,48 0,68 0,47 0,77
NIR + C1 0,91 2,79 3,73 0,86 3,4 5,52 0,84 0,26 0,39 0,8 0,33 0,53
NIR + C2 0,90 3,01 3,95 0,86 3,69 5,64 0,81 0,27 0,42 0,78 0,37 0,62
NIR + SBMx 0,91 2,66 3,88 0,82 4,69 6,39 0,8 0,3 0,44 0,75 0,43 0,68
C1 + C2 0,94 2,21 3,09 0,79 4,02 4,89 0,89 0,18 0,31 0,82 0,31 0,57
C1 + SBMx 0,91 2,64 3,42 0,83 3,84 6,16 0,87 0,25 0,35 0,81 0,37 0,59
C2 + SBMx 0,89 2,72 3,75 0,8 3,57 5,82 0,85 0,27 0,37 0,79 0,31 0,52
Variáveis
relevantes
0,95 2,18 3,05 0,92 2,55 3,49 0,92 0,14 0,26 0,89 0,19 0,38
selecionadas
pela Stepwise
Todas as
0,94 2,35 3,10 0,89 2,8 4,52 0,83 0,22 0,39 0,75 0,38 0,67
Variáveis
4 *VIS – Faixa do Visível; NIR – faixa do infravermelho próximo; C1 – corrente 1 da EFRX; C2 – corrente 2 da EFRX; SBMx – Susceptibilidade
5 magnética
47
dados filtrados pode ser associado alto número de recursos e um baixo número
confiabilidade.
ser facilmente obtida por satélites, que garantem a obtenção dos dados de forma
ainda mais fácil e rápida. Como apontam as métricas, os resultados não teriam
decisões.
na predição de FED e FEO, quando comparado com os dados gerados por ERD.
corroboram com o que foi demonstrado neste trabalho, no qual a fusão e limpeza
modelos preditivos.
melhor modelo gerado com duas fontes para FED (C1 + C2) e para FEO (VIS +
C2). Por fim, selecionamos o modelo gerado pelo VIS por ser um dado de fácil
banco de dados, principalmente para FED. Nota-se que tem uma grande
Tal fato pode ser associado à representatividade da amostra, por se tratar de uma
adequado do padrão.
Além disso, espera-se que a classe com maior ocorrência seja predita com
al., 2017).
relação aos de FED, tais fatos podem ser associados as características únicas da
formação de FEO o que não gera essa clara definição dos compartimentos
extremos, o que pode ser associado a uma baixa densidade amostral desses
valores extremos de FEO no banco de dados. Fato semelhante foi observado por
valores de FEO, mais errático o modelo se torna. Ressaltasse que no trabalho dos
autores acima citados os dados foram mais erráticos, para FED o modelo
da área estudada, entre outros inúmeros fatores. Os resultados mostram qual foi
em outras literaturas (Silva et al., 2020, Bahia et al. 2017) e pela sua transição
estudo que é mais difícil captar a variabilidade em pequena escala de FED. Para
apresentou patamar mais próximo ao dos dados observados, outro ponto que
destacar além disso obteve patamar mais bem estabelecido, quando comparado
semivariogramas, tanto para FED como para FEO e por fim foi calculado ainda o
sete para FEO, além de gráficos violino comparando a distribuição dos dados
formação do solo (Figura 1b). Nestes locais o material de origem para a formação
representando menores valores de FED. É nesta região que temos como rocha
*C0: Efeito pepita. SQR: Soma do quadrado dos resíduos. ADE: Avaliador da dependência espacial
mapa de erro (Figura 9d) para detectar as diferenças entre os mapas. No mapa
variabilidade dos valores de FED nesses locais, o que pode ter influenciado
negativamente na predição.
mostrou muito semelhante ao observado. Vale ressaltar que este modelo utiliza
apenas o sensor FRX o que viabiliza a aplicação mais rápida deste modelo em
pesquisas. Este modelo assim como o anterior também se mostrou mais errático
Por fim, o mapa confeccionado utilizando o modelo obtido com VIS (Figura
9c) foi o que apresentou erros mais evidentes (Figura 9f), superestimando em três
mais errático é possível utilizar este sensor via satélite tal característica viabiliza
55
a sua adoção em grandes áreas com baixo custo (Mello et al., 2021).
ela volta a ter um alargamento, e o mesmo comportamento foi observado nos três
bancos de dados estimados. Nota-se que nas figuras h e g as linhas das medianas
ficaram muito próximas a observada, nota-se que apenas na 9i a linha ficou abaixo
apenas o VIS.
Porém, não tão concentrado como os mapas de FED. Nota-se que mais ao centro
ocorre uma drástica redução nos valores de FEO, justificado pela predominância
os mapas de FEO predito por todos os sensores com limpeza (Figura 10a) em
relação ao observado. Com base no mapa de erro (Figura 10d) é possível notar
que o modelo superestimou FEO para a maior parte do mapa, porém, com valores
em torno de 0,1 de teor de FEO. Nas regiões de maior ocorrência de basalto foram
onde ocorreram os maiores erros, corroborando com o que foi observados nas
regressões anteriormente.
algoritmo utilizado tem eficiência para predição dos teores de FED e FEO,
elementos, respectivamente.
preditos são mais próximos aqueles observados para FED e FEO. Como discutido
o que corrobora com o mapa subestimado com o modelo gerado usando apenas
57
o VIS. Nota-se ainda no violino da figura 10g que o modelo com todos os sensores
Baldo et al. (2021) obtiveram mapas de FED e FEO próximos aos observados
evitar o overfiting (Zhan et al., 2022), pode ter contribuído para os melhores
resultados dos mapas. Estes resultados apontam que a evolução dos modelos
preferível modelos mais arrojados e com maior rigor matemático, como o modelo
financeiros para investimentos, podem ser utilizados modelos mais flexíveis, como
o algoritmo XGBoost, ou até algoritmos mais simples, porém que garantam uma
2.4 Conclusões
58
Hm e Gt.
diversos sensores.
2.5 Referências
Abdikan, S., Sekertekin, A., Narin, O.G., Delen, A., Balik Sanli, F., 2022. A
comparative analysis of SLR, MLR, ANN, XGBoost and CNN for crop height
59
and machine learning. Soil Science Society of America Journal 85, 2185–2200.
https://doi.org/10.1002/saj2.20309
Balsam, W.L., Otto‐Bliesner, B.L., Deaton, B.C., 1995. Modern and Last Glacial
Maximum eolian sedimentation patterns in the Atlantic Ocean interpreted from
sediment iron oxide content. Paleoceanography 10, 493–507.
https://doi.org/10.1029/95PA00421
Baseca, C.C., Sendra, S., Lloret, J., Tomas, J., 2019. A smart decision system for
digital farming. Agronomy 9. https://doi.org/10.3390/agronomy9050216
Basu, D., Sinha, R., Sahu, S., Malla, J., Chakravorty, N., Ghosal, P.S., 2022.
Identification of severity and passive measurement of oxidative stress
biomarkers for β–thalassemia patients: K-means, random forest, XGBoost,
decision tree, neural network based novel framework. Advances in Redox
Research 5, 100034. https://doi.org/10.1016/J.ARRES.2022.100034
Bekker, G.F.H. van G., Addison, M., Addison, P., van Niekerk, A., 2019a. Using
machine learning to identify the geographical drivers of Ceratitis capitata trap
catch in an agricultural landscape. Comput Electron Agric 162, 582–592.
https://doi.org/10.1016/j.compag.2019.05.008
Bekker, G.F.H. van G., Addison, M., Addison, P., van Niekerk, A., 2019b. Using
machine learning to identify the geographical drivers of Ceratitis capitata trap
catch in an agricultural landscape. Comput Electron Agric 162, 582–592.
https://doi.org/10.1016/j.compag.2019.05.008
Borràs, E., Ferré, J., Boqué, R., Mestres, M., Aceña, L., Busto, O., 2015a. Data
fusion methodologies for food and beverage authentication and quality
assessment - A review. Anal Chim Acta 891, 1–14.
https://doi.org/10.1016/j.aca.2015.04.042
Borràs, E., Ferré, J., Boqué, R., Mestres, M., Aceña, L., Busto, O., 2015b. Data
fusion methodologies for food and beverage authentication and quality
assessment - A review. Anal Chim Acta 891, 1–14.
https://doi.org/10.1016/j.aca.2015.04.042
Bowden, C., Foster, T., Parkes, B., 2023. Identifying links between monsoon
variability and rice production in India through machine learning. Sci Rep 13,
1–12. https://doi.org/10.1038/s41598-023-27752-8
Breiman, L., 2001. Random Forest. Mach Learn 45, 5–32.
https://doi.org/10.1017/CBO9781107415324.004
Breiman, Leo, 2001. Random forests. Mach Learn 45, 5–32.
https://doi.org/10.1023/A:1010933404324
Bui, D.T., Tsangaratos, P., Nguyen, V.T., Liem, N. Van, Trinh, P.T., 2020.
Comparing the prediction performance of a Deep Learning Neural Network
model with conventional machine learning models in landslide susceptibility
assessment. Catena (Amst) 188. https://doi.org/10.1016/j.catena.2019.104426
CAMARGO, O.A. de, MONIZ, A.C., JORGE, J.A.J., VALADARES, J.M.A.S., 1986.
Métodos de Análise Química, Mineralógica e Física de Solos do Instituto
Agronômico de Campinas, Boletim Técnico, 106. ed.
Camargo, L.A., Marques Júnior, J., Pereira, G.T., Horvat, R.A., 2009. Variabilidade
espacial de atributos mineralógicos de um Latossolo sob diferentes formas do
relevo. II - Correlação espacial entre mineralogia e agregados. Rev Bras Cienc
Solo 32, 2279–2288. https://doi.org/10.1590/s0100-06832008000600007
Cambule, A.H., Rossiter, D.G., Stoorvogel, J.J., 2013a. A methodology for digital
soil mapping in poorly-accessible areas. Geoderma 192, 341–353.
https://doi.org/10.1016/J.GEODERMA.2012.08.020
61
Cambule, A.H., Rossiter, D.G., Stoorvogel, J.J., 2013b. A methodology for digital
soil mapping in poorly-accessible areas. Geoderma 192, 341–353.
https://doi.org/10.1016/J.GEODERMA.2012.08.020
Camêlo, D. de L., Ker, J.C., Fontes, M.P.F., Corrêa, M.M., da Costa, A.C.S., Melo,
V.F., 2017. Pedogenic Iron Oxides in Iron-Rich Oxisols Developed from Mafic
Rocks. Rev Bras Cienc Solo 41.
https://doi.org/10.1590/18069657RBCS20160379
Canizo, B. V., Escudero, L.B., Pellerano, R.G., Wuilloud, R.G., 2019. Data mining
approach based on chemical composition of grape skin for quality evaluation
and traceability prediction of grapes. Comput Electron Agric 162, 514–522.
https://doi.org/10.1016/j.compag.2019.04.043
Canizo, B. v., Escudero, L.B., Pellerano, R.G., Wuilloud, R.G., 2019. Data mining
approach based on chemical composition of grape skin for quality evaluation
and traceability prediction of grapes. Comput Electron Agric 162, 514–522.
https://doi.org/10.1016/j.compag.2019.04.043
Chagas, C. da S., de Carvalho Junior, W., Bhering, S.B., Calderano Filho, B.,
2016a. Spatial prediction of soil surface texture in a semiarid region using
random forest and multiple linear regressions. Catena (Amst) 139, 232–240.
https://doi.org/10.1016/j.catena.2016.01.001
Chagas, C. da S., de Carvalho Junior, W., Bhering, S.B., Calderano Filho, B.,
2016b. Spatial prediction of soil surface texture in a semiarid region using
random forest and multiple linear regressions. Catena (Amst) 139, 232–240.
https://doi.org/10.1016/J.CATENA.2016.01.001
Chai, T., Draxler, R.R., 2014. Root mean square error (RMSE) or mean absolute
error (MAE)? -Arguments against avoiding RMSE in the literature. Geosci
Model Dev 7, 1247–1250. https://doi.org/10.5194/gmd-7-1247-2014
Chen, T., Guestrin, C., 2016a. XGBoost: A scalable tree boosting system, in:
Proceedings of the ACM SIGKDD International Conference on Knowledge
Discovery and Data Mining. Association for Computing Machinery, pp. 785–
794. https://doi.org/10.1145/2939672.2939785
Chen, T., Guestrin, C., 2016b. XGBoost: A scalable tree boosting system.
Proceedings of the ACM SIGKDD International Conference on Knowledge
Discovery and Data Mining 13-17-August-2016, 785–794.
https://doi.org/10.1145/2939672.2939785
Coblinski, J.A., Giasson, É., Demattê, J.A.M., Dotto, A.C., Costa, J.J.F., Vašát, R.,
2020. Prediction of soil texture classes through different wavelength regions of
reflectance spectroscopy at various soil depths. Catena (Amst) 189, 104485.
https://doi.org/10.1016/j.catena.2020.104485
Cornell, R.M., Schwertmann, U., 2006. The Iron Oxides: Structure, Properties,
Reactions, Occurrences and Uses 707.
da Costa, A.C.S., Junior, I.G. de S., Canton, L.C., Gil, L.G., Figueiredo, R., 2020.
Contribution of the chemical and mineralogical properties of sandy-loam
tropical soils to the cation exchange capacity. Rev Bras Cienc Solo 44, 1–18.
https://doi.org/10.36783/18069657rbcs20200019
de Castro, C.L., Braga, A.P., 2011. Aprendizado supervisionado com conjuntos de
dados desbalanceados. Sba: Controle & Automação Sociedade Brasileira de
Automatica 22, 441–466. https://doi.org/10.1590/S0103-17592011000500002
de Motomiya, A.V.A., Corá, J.E., Pereira, G.T., 2006. Uso da krigagem indicatriz na
avaliação de indicadores de fertilidade do solo. Rev Bras Cienc Solo 30, 485–
496. https://doi.org/10.1590/S0100-06832006000300010
62
Demattê, José Alexandre M, Dotto, A.C., Bedin, L.G., Sayão, V.M., Barros, A., 2019.
Geoderma Soil analytical quality control by traditional and spectroscopy
techniques : Constructing the future of a hybrid laboratory for low environmental
impact. Geoderma 337, 111–121.
https://doi.org/10.1016/j.geoderma.2018.09.010
Demattê, José A.M., Dotto, A.C., Paiva, A.F.S., Sato, M. V., Dalmolin, R.S.D., de
Araújo, M. do S.B., da Silva, E.B., Nanni, M.R., ten Caten, A., Noronha, N.C.,
Lacerda, M.P.C., de Araújo Filho, J.C., Rizzo, R., Bellinaso, H., Francelino,
M.R., Schaefer, C.E.G.R., Vicente, L.E., dos Santos, U.J., de Sá Barretto
Sampaio, E. V., Menezes, R.S.C., de Souza, J.J.L.L., Abrahão, W.A.P.,
Coelho, R.M., Grego, C.R., Lani, J.L., Fernandes, A.R., Gonçalves, D.A.M.,
Silva, S.H.G., de Menezes, M.D., Curi, N., Couto, E.G., dos Anjos, L.H.C.,
Ceddia, M.B., Pinheiro, É.F.M., Grunwald, S., Vasques, G.M., Marques Júnior,
J., da Silva, A.J., Barreto, M.C. de V., Nóbrega, G.N., da Silva, M.Z., de Souza,
S.F., Valladares, G.S., Viana, J.H.M., da Silva Terra, F., Horák-Terra, I., Fiorio,
P.R., da Silva, R.C., Frade Júnior, E.F., Lima, R.H.C., Alba, J.M.F., de Souza
Junior, V.S., Brefin, M.D.L.M.S., Ruivo, M.D.L.P., Ferreira, T.O., Brait, M.A.,
Caetano, N.R., Bringhenti, I., de Sousa Mendes, W., Safanelli, J.L., Guimarães,
C.C.B., Poppiel, R.R., e Souza, A.B., Quesada, C.A., do Couto, H.T.Z., 2019.
The Brazilian Soil Spectral Library (BSSL): A general view, application and
challenges. Geoderma 354, 113793.
https://doi.org/10.1016/j.geoderma.2019.05.043
Dietterich, T., 1995. Overfitting and undercomputing in machine learning. ACM
Computing Surveys (CSUR) 27, 326–327.
https://doi.org/10.1145/212094.212114
dos Santos, F.R., de Oliveira, J.F., Barbosa, G.M.C., Melquiades, F.L., 2021.
Comparison between energy dispersive X-ray fluorescence spectral data and
elemental data for soil attributes modelling. Spectrochim Acta Part B At
Spectrosc 185, 106303. https://doi.org/10.1016/J.SAB.2021.106303
Eberhardt, D.N., Vendrame, P.R.S., Becquer, T., De Fátima Guimarães, M., 2008a.
Influência da granulometria e da mineralogia sobre a retenção do fósforo em
latossolos sob pastagens no cerrado. Rev Bras Cienc Solo 32, 1009–1016.
https://doi.org/10.1590/s0100-06832008000300010
Eberhardt, D.N., Vendrame, P.R.S., Becquer, T., De Fátima Guimarães, M., 2008b.
Influência da granulometria e da mineralogia sobre a retenção do fósforo em
latossolos sob pastagens no cerrado. Rev Bras Cienc Solo 32, 1009–1016.
https://doi.org/10.1590/s0100-06832008000300010
Ebtehaj, I., Bonakdari, H., 2022. A reliable hybrid outlier robust non-tuned rapid
machine learning model for multi-step ahead flood forecasting in Quebec,
Canada. J Hydrol (Amst) 614, 128592.
https://doi.org/10.1016/J.JHYDROL.2022.128592
EMBRAPA, 2017. Manual de metodos de análises, in: Manual de Métodos de
Análise de Solo. Brasilia, DF, p. 574.
Esfandiarpour-Boroujeni, I., Shamsabadi, M.S., Shirani, H., Mosleh, Z., Bagheri
Bodaghabadi, M., Salehi, M.H., 2020. Comparison of error and uncertainty of
decision tree and learning vector quantization models for predicting soil classes
in areas with low altitude variations. Catena (Amst) 191, 104581.
https://doi.org/10.1016/J.CATENA.2020.104581
Fan, S.S., Chang, F.H., Hsueh, H.T., Ko, T.H., 2016. Measurement of Total Free
Iron in Soils by H2S Chemisorption and Comparison with the Citrate
63
Lu, W.N., He, Y., Wang (王阳), Y., Ke, S., 2020. Behavior of calcium isotopes during
continental subduction recorded in meta-basaltic rocks. Geochim Cosmochim
Acta 278, 392–404. https://doi.org/10.1016/J.GCA.2019.09.027
Ma, G., Ding, J., Han, L., Zhang, Z., Ran, S., 2021. Digital mapping of soil
salinization based on Sentinel-1 and Sentinel-2 data combined with machine
learning algorithms. Regional Sustainability 2, 177–188.
https://doi.org/10.1016/J.REGSUS.2021.06.001
Malone, B.P., Jha, S.K., Minasny, B., McBratney, A.B., 2016. Comparing
regression-based digital soil mapping and multiple-point geostatistics for the
spatial extrapolation of soil data. Geoderma 262, 243–253.
https://doi.org/10.1016/J.GEODERMA.2015.08.037
Mancini, M., Andrade, R., Teixeira, A.F. dos S., Silva, S.H.G., Weindorf, D.C.,
Chakraborty, S., Guilherme, L.R.G., Curi, N., 2022. Proximal sensor data fusion
for Brazilian soil properties prediction: Exchangeable/available macronutrients,
aluminum, and potential acidity. Geoderma Regional 30, e00573.
https://doi.org/10.1016/J.GEODRS.2022.E00573
Marques, J., Siqueira, D.S., Camargo, L.A., Teixeira, D.D.B., Barrón, V., Torrent, J.,
2014. Magnetic susceptibility and diffuse reflectance spectroscopy to
characterize the spatial variability of soil properties in a brazilian haplustalf.
Geoderma 219–220, 63–71. https://doi.org/10.1016/j.geoderma.2013.12.007
Maurya, A.K., Bhargava, N., Singh, D., 2022a. Efficient selection of SAR features
using ML based algorithms for accurate FVC estimation. Advances in Space
Research 70, 1795–1809. https://doi.org/10.1016/J.ASR.2022.06.039
Maurya, A.K., Bhargava, N., Singh, D., 2022b. Efficient selection of SAR features
using ML based algorithms for accurate FVC estimation. Advances in Space
Research 70, 1795–1809. https://doi.org/10.1016/J.ASR.2022.06.039
McBratney, A., Gruijter, J., Bryce, A., 2019. Pedometrics timeline. Geoderma 338,
568–575. https://doi.org/10.1016/j.geoderma.2018.11.048
McBratney, A.B., Mendonça Santos, M.L., Minasny, B., 2003. On digital soil
mapping, Geoderma. https://doi.org/10.1016/S0016-7061(03)00223-4
McKeague, J.A., Day, J.H., 1966. DITHIONITE- AND OXALATE-EXTRACTABLE
Fe AND Al AS AIDS IN DIFFERENTIATING VARIOUS CLASSES OF SOILS.
Can J Soil Sci 46, 13–22. https://doi.org/10.4141/cjss66-003
Mehra, O.P., Jackson, M.L., 1958. Iron Oxide Removal from Soils and Clays by a
Dithionite-Citrate System Buffered with Sodium Bicarbonate. Clays and Clay
Minerals 1958 7:1 7, 317–327. https://doi.org/10.1346/CCMN.1958.0070122
Mello, F.A.O., Bellinaso, H., Mello, D.C., Safanelli, J.L., Mendes, W.D.S., Amorim,
M.T.A., Gomez, A.M.R., Poppiel, R.R., Silvero, N.E.Q., Gholizadeh, A., Silva,
S.H.G., Curi, N., Demattê, J.A.M., 2021. Soil parent material prediction through
satellite multispectral analysis on a regional scale at the Western Paulista
Plateau, Brazil. Geoderma Regional 26, e00412.
https://doi.org/10.1016/J.GEODRS.2021.E00412
Mendes, W. de S., Demattê, J.A.M., Bonfatti, B.R., Resende, M.E.B., Campos, L.R.,
Costa, A.C.S. da, 2021. A novel framework to estimate soil mineralogy using
soil spectroscopy. Applied Geochemistry 127, 104909.
https://doi.org/10.1016/J.APGEOCHEM.2021.104909
Mendes, W. de S., Demattê, J.A.M., Minasny, B., Silvero, N.E.Q., Bonfatti, B.R.,
Safanelli, J.L., Rizzo, R., Costa, A.C.S. da, 2022a. Free iron oxide content in
tropical soils predicted by integrative digital mapping. Soil Tillage Res 219.
https://doi.org/10.1016/j.still.2022.105346
67
Mendes, W. de S., Demattê, J.A.M., Minasny, B., Silvero, N.E.Q., Bonfatti, B.R.,
Safanelli, J.L., Rizzo, R., Costa, A.C.S. da, 2022b. Free iron oxide content in
tropical soils predicted by integrative digital mapping. Soil Tillage Res 219,
105346. https://doi.org/10.1016/J.STILL.2022.105346
Merl, T., Rasmussen, M.R., Koch, L.R., Søndergaard, J.V., Bust, F.F., Koren, K.,
2022. Measuring soil pH at in situ like conditions using optical pH sensors (pH-
optodes). Soil Biol Biochem 175, 108862.
https://doi.org/10.1016/J.SOILBIO.2022.108862
Minasny, B., Hartemink, A.E., 2011a. Predicting soil properties in the tropics. Earth
Sci Rev 106, 52–62. https://doi.org/10.1016/j.earscirev.2011.01.005
Minasny, B., Hartemink, A.E., 2011b. Predicting soil properties in the tropics. Earth
Sci Rev 106, 52–62. https://doi.org/10.1016/j.earscirev.2011.01.005
Minasny, B., McBratney, A.B., 2016. Digital soil mapping: A brief history and some
lessons. Geoderma 264, 301–311.
https://doi.org/10.1016/j.geoderma.2015.07.017
Moral, F.J., Rebollo, F.J., Campillo, C., Serrano, J.M., 2019a. Using an objective
and probabilistic model to delineate homogeneous zones in hedgerow olive
orchards. Soil Tillage Res 194, 104308.
https://doi.org/10.1016/j.still.2019.104308
Moral, F.J., Rebollo, F.J., Campillo, C., Serrano, J.M., 2019b. Using an objective
and probabilistic model to delineate homogeneous zones in hedgerow olive
orchards. Soil Tillage Res 194. https://doi.org/10.1016/j.still.2019.104308
Naimi, S., Ayoubi, S., di Raimo, L.A.D.L., Dematte, J.A.M., 2022. Quantification of
some intrinsic soil properties using proximal sensing in arid lands: Application
of Vis-NIR, MIR, and pXRF spectroscopy. Geoderma Regional 28, e00484.
https://doi.org/10.1016/J.GEODRS.2022.E00484
Nawar, S., Delbecque, N., Declercq, Y., Smedt, P. De, Finke, P., Verdoodt, A.,
Meirvenne, M. Van, Mouazen, A.M., 2019. Geoderma Can spectral analyses
improve measurement of key soil fertility parameters with X-ray fl uorescence
spectrometry ? Geoderma 350, 29–39.
https://doi.org/10.1016/j.geoderma.2019.05.002
Nawar, S., Richard, F., Kassim, A.M., Tekin, Y., Mouazen, A.M., 2022. Fusion of
Gamma-rays and portable X-ray fluorescence spectral data to measure
extractable potassium in soils. Soil Tillage Res 223, 105472.
https://doi.org/10.1016/J.STILL.2022.105472
Ng, W., Minasny, B., McBratney, A., 2020a. Convolutional neural network for soil
microplastic contamination screening using infrared spectroscopy. Science of
the Total Environment 702, 134723.
https://doi.org/10.1016/j.scitotenv.2019.134723
Ng, W., Minasny, B., Mcbratney, A., 2020b. Science of the Total Environment
Convolutional neural network for soil microplastic contamination screening
using infrared spectroscopy. Science of the Total Environment 702, 134723.
https://doi.org/10.1016/j.scitotenv.2019.134723
Ng, W., Minasny, B., Montazerolghaem, M., Padarian, J., Ferguson, R., Bailey, S.,
McBratney, A.B., 2019. Convolutional neural network for simultaneous
prediction of several soil properties using visible/near-infrared, mid-infrared,
and their combined spectra. Geoderma 352, 251–267.
https://doi.org/10.1016/j.geoderma.2019.06.016
Nguyen, T.T., Pham, T.D., Nguyen, C.T., Delfos, J., Archibald, R., Dang, K.B.,
Hoang, N.B., Guo, W., Ngo, H.H., 2022a. A novel intelligence approach based
68
active and ensemble learning for agricultural soil organic carbon prediction
using multispectral and SAR data fusion. Science of the Total Environment 804.
https://doi.org/10.1016/j.scitotenv.2021.150187
Nguyen, T.T., Pham, T.D., Nguyen, C.T., Delfos, J., Archibald, R., Dang, K.B.,
Hoang, N.B., Guo, W., Ngo, H.H., 2022b. A novel intelligence approach based
active and ensemble learning for agricultural soil organic carbon prediction
using multispectral and SAR data fusion. Science of The Total Environment
804, 150187. https://doi.org/10.1016/J.SCITOTENV.2021.150187
Nocita, M., Stevens, A., van Wesemael, B., Aitkenhead, M., Bachmann, M., Barthès,
B., Dor, E. Ben, Brown, D.J., Clairotte, M., Csorba, A., Dardenne, P., Demattê,
J.A.M., Genot, V., Guerrero, C., Knadel, M., Montanarella, L., Noon, C.,
Ramirez-Lopez, L., Robertson, J., Sakai, H., Soriano-Disla, J.M., Shepherd,
K.D., Stenberg, B., Towett, E.K., Vargas, R., Wetterlind, J., 2015. Soil
Spectroscopy: An Alternative to Wet Chemistry for Soil Monitoring. Advances
in Agronomy 132, 139–159. https://doi.org/10.1016/bs.agron.2015.02.002
Norrish, K., Taylor, R.M., 1961. The isomorphous replacement of iron by aluminium
in soil goethites. Journal of Soil Science 12, 294–306.
https://doi.org/10.1111/J.1365-2389.1961.TB00919.X
Novais, R.F., Alvarez V., V.H.;, Barros, N.F. de;, Fontes, R.L.F.;, Cantarutti, R.B.;,
Neves, J.C.L., 2007. Fertilidade do solo. Viçosa.
Nowak-Brzezinska, A., Horyn, C., 2020. Outliers in rules - the comparision of LOF,
COF and KMEANS algorithms. Procedia Comput Sci 176, 1420–1429.
https://doi.org/10.1016/J.PROCS.2020.09.152
Oliveira, C. v., Ker, J.C., Fontes, L.E.F., Curi, N., Pinheiro, J.C., 1998. Química e
mineralogia de solos derivados de rochas do Grupo Bambuí no norte de Minas
Gerais. Rev Bras Cienc Solo 22, 583–593. https://doi.org/10.1590/S0100-
06831998000400003
Oliver, M.A., Webster, R., 2014a. A tutorial guide to geostatistics: Computing and
modelling variograms and kriging. Catena (Amst) 113, 56–69.
https://doi.org/10.1016/J.CATENA.2013.09.006
Oliver, M.A., Webster, R., 2014b. A tutorial guide to geostatistics: Computing and
modelling variograms and kriging. Catena (Amst) 113, 56–69.
https://doi.org/10.1016/j.catena.2013.09.006
Padarian, J., Minasny, B., McBratney, A.B., 2019. Using deep learning to predict
soil properties from regional spectral data. Geoderma Regional 16.
https://doi.org/10.1016/j.geodrs.2018.e00198
Pedregosa, F., Michel, V., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R.,
Vanderplas, J., Cournapeau, D., Pedregosa, F., Varoquaux, G., Gramfort, A.,
Thirion, B., Grisel, O., Dubourg, V., Passos, A., Brucher, M., 2011. Scikit-learn:
Machine Learning in Python. The Journal of Machine Learning Research 12,
2825–2830. https://doi.org/10.5555/1953048.2078195
Pedron, F. de A., Lourenzi, C.R., Ceretta, C.A., Lorensi, J., Cancian, A., 2018. Clay
mineralogy of subtropical soils under long-term organic fertilization in no-tillage
systems. Rev Bras Cienc Solo 42.
https://doi.org/10.1590/18069657rbcs20170092
Ramaroson, V.H., Becquer, T., Sá, S.O., Razafimahatratra, H., Delarivière, J.L.,
Blavet, D., Vendrame, P.R.S., Rabeharisoa, L., Rakotondrazafy, A.F.M., 2018.
Mineralogical analysis of ferralitic soils in Madagascar using NIR spectroscopy.
Catena (Amst) 168, 102–109. https://doi.org/10.1016/j.catena.2017.07.016
Reda, R., Saffaj, T., Ilham, B., Saidi, O., Issam, K., Brahim, L., El Hadrami, E.M.,
69
2019. A comparative study between a new method and other machine learning
algorithms for soil organic carbon and total nitrogen prediction using near
infrared spectroscopy. Chemometrics and Intelligent Laboratory Systems 195.
https://doi.org/10.1016/j.chemolab.2019.103873
Rennert, T., 2019. Wet-chemical extractions to characterise pedogenic Al and Fe
species-a critical review. Soil Research 57, 1–16.
https://doi.org/10.1071/SR18299
Rosin, N.A., Demattê, J.A.M., Leite, M.C.A., de Carvalho, H.W.P., Costa, A.C.,
Greschuk, L.T., Curi, N., Silva, S.H.G., 2022. The fundamental of the effects of
water, organic matter, and iron forms on the pXRF information in soil analyses.
Catena (Amst) 210. https://doi.org/10.1016/j.catena.2021.105868
Rossiter, D.G., 2018. Past, present & future of information technology in
pedometrics. Geoderma 324, 131–137.
https://doi.org/10.1016/j.geoderma.2018.03.009
Ruhollah, T.-M., Sheikhpour, R., Zeraatpisheh, M., Amirian-Chakan, A., Toomanian,
N., Kerry, R., Scholten, T., 2022a. Semi-supervised learning for the spatial
extrapolation of soil information. Geoderma 426, 116094.
https://doi.org/10.1016/J.GEODERMA.2022.116094
Ruhollah, T.-M., Sheikhpour, R., Zeraatpisheh, M., Amirian-Chakan, A., Toomanian,
N., Kerry, R., Scholten, T., 2022b. Semi-supervised learning for the spatial
extrapolation of soil information. Geoderma 426, 116094.
https://doi.org/10.1016/J.GEODERMA.2022.116094
Ruiz, H.A., Ferreira, G.B., Pereira, J.B.M., Resumo, ), 2003. Estimativa da
capacidade de campo de Latossolos e Neossolos Quartzarênicos pela
determinação do equivalente de umidade. Rev Bras Cienc Solo 27, 389–393.
https://doi.org/10.1590/S0100-06832003000200019
Santos, H.G. dos, Jacomine, P.K.T., Anjos, L.H.C. dos, Oliveira, V.Á. de,
Lumbreras, J.F., Coelho, M.R., Almeida, J.A. de, Filho, J.C. de A., Oliveira, J.B.
de, Cunha, T.J.F., 2018. Sistema brasileiro de classificação de solos, 5th ed,
Embrapa Solos. Embrapa, Brasilia.
Sarfraz, S., Ali, F., Hameed, A., Ahmad, Z., Riaz, K., 2023. Sustainable Agriculture
Through Technological Innovations. Sustainable Agriculture in the Era of the
OMICs Revolution 223–239. https://doi.org/10.1007/978-3-031-15568-0_10
Schwertmann, U., Taylor, R.M., 2018. Iron oxides. Minerals in Soil Environments
379–438. https://doi.org/10.2136/sssabookser1.2ed.c8
Shahhosseini, M., Hu, G., Huber, I., Archontoulis, S. V., 2021. Coupling machine
learning and crop modeling improves crop yield prediction in the US Corn Belt.
Sci Rep 11, 1–15. https://doi.org/10.1038/s41598-020-80820-1
Shrestha, G., Calvelo-Pereira, R., Roudier, P., Martin, A.P., Turnbull, R.E.,
Kereszturi, G., Jeyakumar, P., Anderson, C.W.N., 2022. Quantification of
multiple soil trace elements by combining portable X-ray fluorescence and
reflectance spectroscopy. Geoderma 409, 115649.
https://doi.org/10.1016/J.GEODERMA.2021.115649
Silva, F.M., Silva, S.H.G., Acuña-Guzman, S.F., Silva, E.A., Ribeiro, B.T., Fruett, T.,
Inda, A.V., Teixeira, A.F. dos S., Mancini, M., Guilherme, L.R.G., Curi, N., 2021.
Chemical and mineralogical changes in the textural fractions of quartzite-
derived tropical soils, along weathering, assessed by portable X-ray
fluorescence spectrometry and X-ray diffraction. J South Am Earth Sci 112,
103634. https://doi.org/10.1016/J.JSAMES.2021.103634
Silva, F.M., Silva, S.H.G., Teixeira, A.F. dos S., Inda, A.V., Fruett, T., Weindorf,
70
D.C., Guilherme, L.R.G., Curi, N., 2022a. Using proximal sensors to assess
pedogenetic development of Inceptisols and Oxisols in Brazil. Geoderma
Regional 28, 1–10. https://doi.org/10.1016/j.geodrs.2021.e00465
Silva, F.M., Silva, S.H.G., Teixeira, A.F. dos S., Inda, A.V., Fruett, T., Weindorf,
D.C., Guilherme, L.R.G., Curi, N., 2022b. Using proximal sensors to assess
pedogenetic development of Inceptisols and Oxisols in Brazil. Geoderma
Regional 28, e00465. https://doi.org/10.1016/J.GEODRS.2021.E00465
Silva, L.S., Marques Júnior, J., Barrón, V., Gomes, R.P., Teixeira, D.D.B., Siqueira,
D.S., Vasconcelos, V., 2020a. Spatial variability of iron oxides in soils from
Brazilian sandstone and basalt. Catena (Amst) 185, 104258.
https://doi.org/10.1016/j.catena.2019.104258
Silva, L.S., Marques Júnior, J., Barrón, V., Gomes, R.P., Teixeira, D.D.B., Siqueira,
D.S., Vasconcelos, V., 2020b. Spatial variability of iron oxides in soils from
Brazilian sandstone and basalt. Catena (Amst) 185, 104258.
https://doi.org/10.1016/J.CATENA.2019.104258
Silva, S.H.G., Menezes, M.D. de, Owens, P.R., Curi, N., 2016. Retrieving
pedologist’s mental model from existing soil map and comparing data mining
tools for refining a larger area map under similar environmental conditions in
Southeastern Brazil. Geoderma 267, 65–77.
https://doi.org/10.1016/J.GEODERMA.2015.12.025
Silvero, N.E.Q., Siqueira, D.S., Coelho, R.M., da Costa Ferreira, D., Marques, J.,
2019. Protocol for the use of legacy data and magnetic signature on soil
mapping of São Paulo Central West, Brazil. Science of The Total Environment
693, 133463. https://doi.org/10.1016/J.SCITOTENV.2019.07.269
Soriano-Disla, J.M., Janik, L.J., Viscarra Rossel, R.A., MacDonald, L.M.,
McLaughlin, M.J., 2014. The performance of visible, near-, and mid-infrared
reflectance spectroscopy for prediction of soil physical, chemical, and biological
properties. Appl Spectrosc Rev 49, 139–186.
https://doi.org/10.1080/05704928.2013.811081
Sothe, C., Almeida, C.M. De, Schimalski, M.B., Liesenberg, V., Rosa, L.E.C. La,
Castro, J.D.B., Feitosa, R.Q., 2019. A comparison of machine and deep-
learning algorithms applied to multisource data for a subtropical forest area
classification. https://doi-
org.ez87.periodicos.capes.gov.br/10.1080/01431161.2019.1681600.
https://doi.org/10.1080/01431161.2019.1681600
Sothe, C., de Almeida, C.M., Schimalski, M.B., Liesenberg, V., la Rosa, L.E.C.,
Castro, J.D.B., Feitosa, R.Q., 2020. A comparison of machine and deep-
learning algorithms applied to multisource data for a subtropical forest area
classification. Int J Remote Sens 41, 1943–1969.
https://doi.org/10.1080/01431161.2019.1681600
Souza, E.D., Carneiro, M.A.C., Paulino, H.B., 2005. Atributos físicos de um
Neossolo Quartzarênico e um Latossolo Vermelho sob diferentes sistemas de
manejo. Pesqui Agropecu Bras 40, 1135–1139. https://doi.org/10.1590/S0100-
204X2005001100012
Stranghoener, M., Dultz, S., Behrens, H., Schippers, A., 2020. Potential mobilizable
Fe from secondary phases of differentially altered subsurface basaltic rock– a
sequential extraction study on ICDP site Hawaii. Applied Geochemistry 121,
104705. https://doi.org/10.1016/J.APGEOCHEM.2020.104705
Suits, D.B., 1957. Use of Dummy Variables in Regression Equations. J Am Stat
Assoc 52, 548. https://doi.org/10.2307/2281705
71
Sumathi, K., 2018. Data Analytics platform for intelligent agriculture. 2018 2nd
International Conference on I-SMAC (IoT in Social, Mobile, Analytics and
Cloud) (I-SMAC)I-SMAC (IoT in Social, Mobile, Analytics and Cloud) (I-SMAC),
2018 2nd International Conference on 647–650. https://doi.org/10.1109/I-
SMAC.2018.8653740
Sun, Z., Wang, J., Wang, Y., Long, L., Luo, Z., Deng, X., Hu, Q., Wang, M., 2020.
Sodium-rich volcanic rocks and their relationships with iron deposits in the
Aqishan–Yamansu belt of Eastern Tianshan, NW China. Geoscience Frontiers
11, 697–713. https://doi.org/10.1016/J.GSF.2019.06.011
Swetha, R.K., Dasgupta, S., Chakraborty, S., Li, B., Weindorf, D.C., Mancini, M.,
Silva, S.H.G., Ribeiro, B.T., Curi, N., Ray, D.P., 2022. Using Nix color sensor
and Munsell soil color variables to classify contrasting soil types and predict soil
organic carbon in Eastern India. Comput Electron Agric 199, 107192.
https://doi.org/10.1016/J.COMPAG.2022.107192
Tabatabai, S., Knadel, M., Thomsen, A., Greve, M.H., 2019. On-the-Go Sensor
Fusion for Prediction of Clay and Organic Carbon Using Pre-processing
Survey, Different Validation Methods, and Variable Selection. Soil Science
Society of America Journal 83, 300–310.
https://doi.org/10.2136/SSSAJ2018.10.0377
Takoutsing, B., Heuvelink, G.B.M., 2022. Comparing the prediction performance,
uncertainty quantification and extrapolation potential of regression kriging and
random forest while accounting for soil measurement errors. Geoderma 428,
116192. https://doi.org/10.1016/J.GEODERMA.2022.116192
Teixeira, A.F. dos S., Andrade, R., Mancini, M., Silva, S.H.G., Weindorf, D.C.,
Chakraborty, S., Guilherme, L.R.G., Curi, N., 2022. Proximal sensor data fusion
for tropical soil property prediction: Soil fertility properties. J South Am Earth Sci
116, 103873. https://doi.org/10.1016/J.JSAMES.2022.103873
Teixeira, A.F. dos S., Henrique Procópio Pelegrino, M., Missina Faria, W., Henrique
Godinho Silva, S., Gabriela Marcolino Gonçalves, M., Weimar Acerbi Júnior,
F., Rezende Gomide, L., Linares Pádua Júnior, A., de Souza, I.A., Chakraborty,
S., Weindorf, D.C., Roberto Guimarães Guilherme, L., Curi, N., 2020. Tropical
soil pH and sorption complex prediction via portable X-ray fluorescence
spectrometry. Geoderma 361, 114132.
https://doi.org/10.1016/j.geoderma.2019.114132
Teixeira, R.S., Vendrame, P.R.S., Christoni, A.R.F., SILVA, P.R.C., 2016. QUÍMICA
E MINERALOGIA DE UM SOLO DESENVOLVIDO DE BASALTO,
COLETADO ATRAVÉS DE SONDAGEM SPT. Boletim de Geografia 34, 116–
126. https://doi.org/10.4025/bolgeogr.v34i2.28948
Temme, A.J.A.M., Veldkamp, A., 2009. Multi-process Late Quaternary landscape
evolution modelling reveals lags in climate response over small spatial scales.
Earth Surf Process Landf 34, 573–589. https://doi.org/10.1002/ESP.1758
ten Caten, A., Dalmolin, R.S.D., Pedron, F. de A., Santos, M. de L.M., 2011a.
Extrapolação das relações solo-paisagem a partir de uma área de referência.
Ciência Rural 41, 812–816. https://doi.org/10.1590/S0103-
84782011000500012
ten Caten, A., Dalmolin, R.S.D., Pedron, F. de A., Santos, M. de L.M., 2011b.
Extrapolação das relações solo-paisagem a partir de uma área de referência.
Ciência Rural 41, 812–816. https://doi.org/10.1590/S0103-
84782011000500012
Thompson, J.A., Roecker, S., Grunwald, S., Owens, P.R., 2012. Digital Soil
72
ecologically fragile karst basin using a machine learning model. Environ Res
214, 113843. https://doi.org/10.1016/J.ENVRES.2022.113843
Xu, S., Zhao, Y., Wang, M., Shi, X., 2018. Quantification of Different Forms of Iron
from Intact Soil Cores of Paddy Fields with Vis-NIR Spectroscopy. Soil Science
Society of America Journal 82, 1497–1511.
https://doi.org/10.2136/SSSAJ2018.01.0014
Yan, F., Shangguan, W., Zhang, J., Hu, B., 2020a. Depth-to-bedrock map of China
at a spatial resolution of 100 meters. Sci Data 7, 1–13.
https://doi.org/10.1038/s41597-019-0345-6
Yan, F., Shangguan, W., Zhang, J., Hu, B., 2020b. Depth-to-bedrock map of China
at a spatial resolution of 100 meters. Scientific Data 2020 7:1 7, 1–13.
https://doi.org/10.1038/s41597-019-0345-6
Ye, M., Zhu, L., Li, X., Ke, Y., Huang, Y., Chen, B., Yu, H., Li, H., Feng, H., 2023.
Estimation of the soil arsenic concentration using a geographically weighted
XGBoost model based on hyperspectral data. Science of The Total
Environment 858, 159798.
https://doi.org/10.1016/J.SCITOTENV.2022.159798
Zanotti, C., Rotiroti, M., Sterlacchini, S., Cappellini, G., Fumagalli, L., Stefania, G.A.,
Nannucci, M.S., Leoni, B., Bonomi, T., 2019. Choosing between linear and
nonlinear models and avoiding overfitting for short and long term groundwater
level forecasting in a linear system. J Hydrol (Amst) 578, 124015.
https://doi.org/10.1016/J.JHYDROL.2019.124015
Zeraatpisheh, M., Ayoubi, S., Jafari, A., Finke, P., 2017. Comparing the efficiency
of digital and conventional soil mapping to predict soil types in a semi-arid
region in Iran. Geomorphology 285, 186–204.
https://doi.org/10.1016/J.GEOMORPH.2017.02.015
Zevenbergen, C., Honders, A., Orbons, A.J., Viaene, W., Swennen, R., Comans,
R.N.J., van Hasselt, H.J., 1997. Immobilisation of heavy metals in contaminated
soils by thermal treatment at intermediate temperatures. Studies in
Environmental Science 71, 661–672. https://doi.org/10.1016/S0166-
1116(97)80249-X
Zhan, Y., Liu, C., Deng, Q., Feng, Q., Qiu, Y., Zhang, A., He, X., 2022. Integrated
FFT and XGBoost framework to predict pavement skid resistance using
automatic 3D texture measurement. Measurement 188, 110638.
https://doi.org/10.1016/J.MEASUREMENT.2021.110638
Zhang, R., Li, Y., Goh, A.T.C., Zhang, W., Chen, Z., 2021. Analysis of ground
surface settlement in anisotropic clays using extreme gradient boosting and
random forest regression models. Journal of Rock Mechanics and
Geotechnical Engineering 13, 1478–1484.
https://doi.org/10.1016/J.JRMGE.2021.08.001
Zhang, W. chun, Wan, H. shuang, Zhou, M. hou, Wu, W., Liu, H. bin, 2022. Soil total
and organic carbon mapping and uncertainty analysis using machine learning
techniques. Ecol Indic 143, 109420.
https://doi.org/10.1016/J.ECOLIND.2022.109420
Zhao, D., Wang, Junjie, Jiang, X., Zhen, J., Miao, J., Wang, Jingzhe, Wu, G., 2022a.
Reflectance spectroscopy for assessing heavy metal pollution indices in
mangrove sediments using XGBoost method and physicochemical properties.
Catena (Amst) 211, 105967. https://doi.org/10.1016/J.CATENA.2021.105967
Zhao, D., Wang, Junjie, Jiang, X., Zhen, J., Miao, J., Wang, Jingzhe, Wu, G., 2022b.
Reflectance spectroscopy for assessing heavy metal pollution indices in
74
Abstract: The main arable soils in Brazil are characterized as highly weathered,
with iron minerals playing a fundamental role in soil dynamics, acting as a
pedoindicator for various purposes. The indirect estimation of these minerals is
extremely important since traditional quantification methods imply high analysis
costs and longer time to obtain data. Given this context, the objective was (i) to
estimate soil mineralogical attributes using machine learning (ML) algorithms, based
on the spectral curves generated by Diffuse Reflectance Spectroscopy (DRS) in a
smaller Reference Area (RA) and with denser collection points, and (ii) extrapolate
the prediction parameters to a larger Target Area (TA), with fewer collection points.
RA is located in the municipality of Guatapará, in the northeast of the state of São
Paulo, Brazil, with approximately 870 hectares and 360 collection points. The TA is
the Western Paulista Plateau (WPP), which corresponds to approximately 48% of
the entire State of São Paulo, totaling 13 million hectares and with 231 collection
points. We used the Random Forests (RF) and XGBoost (XGB) ML algorithms to
predict the Iron Dithionite (FED) and Iron Oxalate (FEO) attributes in the soil and
train the algorithms with the RA parameters and extrapolate to the TA. The XGB
algorithm was more efficient in extrapolating the RA parameters to predict the FED
values in the TA with an R2= 85.30% against 76.33% for the RF. For FEO, the RF
algorithm presented a higher value of R2= 57.88% against 54.67% for the XGB
algorithm, however, the error values were lower for the XGB algorithm. ML
algorithms are efficient in predicting and extrapolating soil mineralogical attribute
values, provided that robust algorithms are used and that the database has enough
observations for adequate training of the models. The use of the DRS sensor,
associated with machine learning models, is efficient in predicting soil mineralogical
attributes, and this combination of techniques has great potential for soil science.
3.1 Introdução
ácido oxálico aos óxidos de ferro amorfos pela complexação entre oxalato e ferro
denominado como “Ferro Ditionito” (Zevenbergen et al., 1997; Lee et al., 2018).
2018).
2023, 2013; Naimi et al., 2022). Segundo Silva et al. (2020), a ERD, apresenta baixo
mínima da amostra.
aprendizagem de máquina (AM) vem a cada dia sendo mais aplicado a ciência do
solo, pois são mais precisos na estimativa de atributos de interesse do que técnicas
(FA) que é uma técnica não paramétrica que foi desenvolvida com o intuito de
complexos.
espacial podem ser usados para prever solos em locais não visitados, porém,
79
extrapolação pode ser aplicada para prever os solos na área alvo (locais sem
(ten Caten et al., 2011b). Portanto, um modelo AM desenvolvido para uma área de
solo utilizando algoritmos de aprendizagem de máquina (AM), com base nas curvas
Área de Referência (AR) menor e com pontos de coleta mais adensados, (ii)
extrapolar os parâmetros da predição para uma Área Alvo (AA) maior, e com menos
solo.
áreas (Área de Referência e Área Alvo) (Figura 1). A Área de Referência está
anos.
Quartzarênico órtico distrófica textura arenosa. Para esta área foi definida uma
grade amostral com aproximadamente 1 ponto a cada 2,5 hectares, totalizando 360
nacional de etanol, açúcar e citros e vem sendo estudada por vários outros
pesquisadores do grupo CSME (Bahia et al., 2015; Silvero et al., 2019; Silva et al.,
(b)
(a)
Estradas de Rodagem (DER). A partir desse arquivo criamos um mapa por meio da
ferro extraídos por amônio-ácido oxálico (FEO), relativos aos óxidos de ferro
terra fina seca ao ar (TFSA) foram acomodadas em porta amostra individual (3,0
VISível (VIS), entre 250 e 900 nanômetros (nm) e do infravermelho próximo (NIR)
et al., 2022a). Ele consiste em uma variação dos algoritmos de árvore de decisão
83
sequencialmente otimizadas.
70% para treino e 30% para teste. Pensando que o algoritmo é impulsionado pelo
técnica não paramétrica que foi desenvolvida com o intuito de melhorar a previsão
decisão totalmente crescidas e reduz o erro e a variação (Yan et al., 2020b). Tal
et al., 2016b).
3.2.6 Geoestatística
N (h)
1
ˆ (h) =
2 N ( h)
[ z( x ) − z( x
i =1
i i + h)] 2 (1)
não foi medida, fazendo uso da krigagem (Oliver; Webster, 2014). Para todas as
apresentado na Figura 3.
85
Figura 3. Fluxograma do passo a passo do processamento de dados até a obtenção dos mapas dos atributos analisados para a
área de referência e área alvo.
1
86
dos dados foi realizada a estatística descritiva para o FED e FEO (Tabela 1).
Tabela 1. Análise descritiva dos dados de FED e FEO das áreas de referência e
alvo.
Área de Referência FED FEO
CV 71,24% 68,42%
Desvio Padrão 37,75 1,40
Máximo 177,71 7,44
Mediana 40,64 1,93
Média 53,00 2,05
Mínimo 1,99 0,04
Área Alvo FED FEO
CV 62,29% 100,25%
Desvio Padrão 14,32 1,17
Máximo 76,38 5,89
Mediana 17,69 0,70
Média 22,99 1,17
Mínimo 4,93 0,19
FED: Ferro Ditionito; FEO: Ferro Oxalato; CV: coeficiente de variação. N (número
de observações) na área de referência: 360; na área alvo: 231.
pela baixa atividade das argilas e capacidade de troca de cátions. Além disso, são
principais solos utlizados para produção agrícola no Brasil (Novais et al., 2007).
padrão indicando que os dados dessa área são mais dispersos do que o da área
comparado com os valores da área alvo. Estes resultados podem ser associados
à transição dos tipos de solo e geologias de origem desses solos, uma vez que
Diferente do observado para FED, para FEO observa-se que na área alvo o
apresenta maior variabilidade dos atributos quando comparada a área alvo, tal fato
pode ser atribuído ao grid de coleta de solo mais denso estabelecido para a área
de referência, fazendo com que maior variabilidade espacial dos atributos seja
88
foram observadas as medidas de forma (curtose e assimetria) (Tabela 2). Para FED
de FED ficou muito próxima de zero, indicando assim uma curva de padrão normal,
ou seja, mesocúrtica.
Tabela 2. Valores de curtose a assimetria dos dados de FED e FEO das áreas de
referência e alvo.
Área de Referência FED FEO
Curtose -0,84 0,03
Assimetria 0,49 0,45
Área Alvo FED FEO
Curtose 0,03 3,76
Assimetria 1,04 2,05
FED: Ferro Ditionito; FEO: Ferro Oxalato.
distribuição bimodal dos dados de FED da área de referência, o que não ocorre
para os dados de FED da área alvo nem para os dados de FEO de nenhuma das
observada presença de simetria positiva, sendo essa mais intensa na área alvo
amostral de ambas as áreas, como na área alvo foram coletadas menos amostras,
área de referência maior amplitude de dados do que na área alvo, tal diferença fica
distribuição mais homogênea quando comparada a alvo, o que pode ser atribuído
a maior densidade amostral desta área quando comparada com a área alvo, logo
homogénea.
(a)
90
(b)
Figura 4. Distribuição dos dados de FED (a) e FEO (b) das áreas de referência e
alvo. FED: Ferro Ditionito; FEO: Ferro Oxalato.
Tal fato fica ainda mais nítido no gráfico referente a FED (Figura 4a), no qual
valores baixos na área alvo, porém com distribuição mais homogênea e parelha,
nota-se que ela não reduz de forma abrupta como para FED. Além disso ambas as
referência apresenta alguns valores máximos mais extremos do que a área alvo.
As áreas com maiores teores de FED são as argilosas, quem ficam mais nas
referência, áreas com solos mais argilosos estão presentes em maior parte da área,
o que pode ocasionar a distribuição mais bem distribuída desses elementos, uma
vez que já se espera maior teor desses óxidos quanto maior o teor de argila dos
solos (Camêlo et al., 2017; Silva et al., 2020b). A presença mais homogênea de
FEO nas áreas pode ser associada as características únicas da formação de FEO,
que não apresentando tão grande diferenciação em sua formação em função dos
distribuição entre as áreas quando comparado com FED, tal afirmação corrobora
referência, logo entendem-se que o padrão da área alvo existe dentro da base de
máquina.
métrica para ambos os atributos foi o da área de referência, tanto na etapa de treino
treinamento, em vez de encontrar uma regra preditiva geral (Dietterich, 1995). Caso
O modelo de pior performance tanto para FED como para FEO foi o de
quando comparados com os demais modelos. Este resultado pode ser atribuído à
93
baixa densidade amostral existente na base de dados da área alvo. Além disso, o
a performance do algoritmo pode ter sido afetada pela presença dos outliers, uma
vez que o desempenho de algoritmos preditivos pode ser severamente afetado pela
presença de outliers nos dados experimentais, o que torna o algoritmo não robusto
pode ser atribuído à robustez da base de dados da área de referência, que por
porque por diminuir a densidade amostral dos dados a serem preVIStos reduz
o da área alvo. Este resultado indica que esse modelo foi o menos impactado pela
presença de outliers nas bases de dados, uma vez que por haver maior densidade
algoritmos foram melhor treinados, o que faz com que a menor ocorrência de
outliers seja menos prejudicial para os valores de RMSE (Chai; Draxler, 2014).
premissa que o modelo foi treinado e testado em áreas diferentes, logo a margem
de erro da predição seria maior, similar aos resultados apresentados por Angelini
et al. (2020) e Ruhollah et al. (2022) que, trabalhando com modelos de predição e
melhores do que para FED, o que pode ser associado à distribuição mais
Porém, nota-se que este modelo foi muito penalizado pelos outliers,
apresentando um RMSE ligeiramente mais alto do que nos modelos das áreas de
nos modelos. Porém, nota-se maiores diferenças nos modelos de FED, o que pode
ser atribuído à distribuição dos dados desse atributo, que é mais heterogênea do
que a de FEO, logo, sendo os modelos desenvolvidos para FEO mais penalizados
erro podem ser atribuídos às diferentes bases apresentadas nas etapas de treino
e teste. Por mais que com base na distribuição dos dados das bases utilizadas os
estas são áreas distintas. Entretanto, mesmo com valores de erro mais elevados, é
(Wang et al., 2022), meteorologia florestal (Ghafarian et al., 2022), água no solo
(Karthikeyan; and Mishra, 2021), modelos de física do solo (Zhang et al., 2021),
salinização do solo (Ma et al., 2021), erosão do solo e da água (Golkarian et al.,
2023), carbono do solo (He et al., 2022; Nguyen et al., 2022b; Zhang et al., 2022),
solo (Ye et al., 2023; D. Zhao et al., 2022a), entre outras aplicações, o que tem
feito esse algoritmo despontar nos últimos anos, sendo na grande maioria das
5a, 5b e 5c) é possível notar maior espalhamento dos dados preditos pelo modelo
Esta condição pode ser atribuída à baixa densidade amostral nas áreas de
transição e é possível notar ainda que nesta região ocorre maior concentração de
pontos dispersos, tanto na Figura 5b bem como na Figura 5c, indicando que o
algoritmo não foi capaz de estimar corretamente estes pontos, logo, tornando-se
g/kg
g/kg
g/kg
g/kg
g/kg
g/kg
g/kg g/kg g/kg
Figura 5. Análise de regressão dos dados preditos e observados de FED e FEO. (a) FED Área de referência; (b) FED Área Alvo; (c)
FED extrapolado da Área de Referência para a Área Alvo; (d) FEO Área de referência; (e) FEO Área Alvo; (f) FEO extrapolado da
Área de Referência para a Área Alvo; FED: Ferro Ditionito; FEO: Ferro Oxalato; FA: Florestas Aleatórias; XGB: XGBoost.
98
possível notar que a referente à extrapolação de FEO foi a que houve maior
desse atributo.
realizadas as krigagem dos dados observados e dos dados preditos por cada
FEO área de referência; Figuras 10a, 10b e 10c – FEO área alvo; Figuras 11a, 11b
De modo geral tanto para FED como para FEO os semivariogramas dos
pois a sua transição ocorre de forma mais rápida (Motomiya et al., 2006). O modelo
Webster (2014) relatam que existem vários fatores que prejudicam a confiabilidade
pois quanto mais dados você tiver, maior será a precisão, porém, mais difícil tende
a ser o ajuste, uma vez que a amostragem capta melhor a variabilidade a curtas
distâncias.
alcance muito semelhantes entre si, podendo inferir que os modelos apresentaram
mudanças abruptas nos valores de FED ao longo da área, o que pode ser atribuído
algoritmo XGBoost (Figura 6c). Neste mapa é possível visualizar com precisão o
Aleatória superestima os valores de FED, assim como nas bordas da parte superior
do mapa. Este resultado não é observado no mapa gerado com base no modelo do
No gráfico violino (Figura 6d) é possível notar no box-plot que as três bases
dados observada.
101
observado e estimados pelo algoritmo XGBoost, nos outros dois gráficos violinos.
alvo (Figura 7). Nota-se uma grande semelhança entre eles, porém, assim como
nos mapas anteriores, a semelhança maior entre os mapas dos dados observados
que foi observado na tabela de métricas (Tabela 3) e nas regressões (Figura 5).
Aleatórias o mapa perdeu uma de suas áreas de transição, o que ocasionou a perda
de qualidade da informação em uma parte do mapa. Este efeito fica ainda mais
dados. Este resultado pode ser explicado pelas regressões da Figura 5, onde é
dados. Logo, o modelo não foi capaz de estimar com precisão os dados dessas
do violino.
O oposto foi observado no mapa dos dados preditos pelo algoritmo XGBoost,
que não foi tão assertivo em valores extremos como podemos notar no violino, mas
que conseguiu lidar com a zona de transição de forma mais apropriada. Abdikan et
XGBoost e Rede Neural Convolucional) obteve o resultado que o XGBoost foi mais
103
transição dos dados, o que pode ser atribuído ao incremento da base de dados e
O mapa dos dados preditos pelo XGBoost (Figura 8c) mostrou-se muito
a importância da detecção de outliers, para que os padrões nos dados possam ser
9a). Em ambos os mapas desenvolvidos com base nos modelos os valores foram
superestimados em algumas regiões. Nota-se que isso foi mais evidente nos dados
observar o gráfico violino (Figura 9d), o contorno que corresponde a frequência dos
Resultados similares foram observados por Liu et al. (2022) que utilizando de
modelos mais erráticos sempre nos valores mais extremos do banco de dados.
107
alvo (Figura 10). Nota-se que no mapa desenvolvido com os dados preditos pelo
nas demais partes apresentou valores muito similares com os observados no mapa
distribuição semelhante dos dados, sendo que apenas o violino referente aos dados
superior.
(h)
Figura 10. Mapas, semivariogramas e gráficos violinos referentes ao atributo FEO no solo da Área Alvo: (a) dados observados; (b)
dados preVIStos usando Florestas Aleatórias; (c) dados preVIStos usando XGBoost; (d) gráficos de violino; (e) semivariograma
dados observados; (f) semivariograma Florestas Aleatórias; (g) semivariograma XGBoost; (h) métricas de ajuste dos
semivariogramas. FEO: Ferro Oxalato.
110
extrapolação de FEO (Figura 11). No mapa referente aos dados estimados pelo
O mapa referente aos dados estimados pelo modelo XGBoost (Figura 11c)
apresentou maior semelhança com o mapa dos dados observados (Figura 11a),
Bonakdari, 2022).
111
3.4 Conclusões
FEO é possível e assertivo, desde que haja uma base de dados robusta e que as
3.5 Referências
Abdikan, S., Sekertekin, A., Narin, O.G., Delen, A., Balik Sanli, F., 2022. A comparative
analysis of SLR, MLR, ANN, XGBoost and CNN for crop height estimation of
sunflower using Sentinel-1 and Sentinel-2. Advances in Space Research.
https://doi.org/10.1016/J.ASR.2022.11.046
Afshar, F.A., Ayoubi, S., Jafari, A., 2018a. The extrapolation of soil great groups using
multinomial logistic regression at regional scale in arid regions of Iran. Geoderma
315, 36–48. https://doi.org/10.1016/J.GEODERMA.2017.11.030
Afshar, F.A., Ayoubi, S., Jafari, A., 2018b. The extrapolation of soil great groups using
multinomial logistic regression at regional scale in arid regions of Iran. Geoderma
315, 36–48. https://doi.org/10.1016/J.GEODERMA.2017.11.030
Almeida, G.M. de, Pereira, G.T., Bahia, A.S.R. de S., Fernandes, K., Marques Júnior,
J., 2021. Machine learning in the prediction of sugarcane production
environments. Comput Electron Agric 190.
https://doi.org/10.1016/j.compag.2021.106452
Almeida, G.M. de, Pereira, G.T., Bahia, A.S.R.D.S., Júnior, J.M., 2020. Aprendizagem
de máquina na predição de ambientes de produção de cana-de-açúcar. Comput
Electron Agric.
Andrade, R., Mancini, M., Teixeira, A.F. dos S., Silva, S.H.G., Weindorf, D.C.,
Chakraborty, S., Guilherme, L.R.G., Curi, N., 2022. Proximal sensor data fusion
and auxiliary information for tropical soil property prediction: Soil texture.
Geoderma 422, 115936. https://doi.org/10.1016/J.GEODERMA.2022.115936
Angelini, M.E., Kempen, B., Heuvelink, G.B.M., Temme, A.J.A.M., Ransom, M.D.,
2020a. Extrapolation of a structural equation model for digital soil mapping.
Geoderma 367, 114226. https://doi.org/10.1016/J.GEODERMA.2020.114226
113
Angelini, M.E., Kempen, B., Heuvelink, G.B.M., Temme, A.J.A.M., Ransom, M.D.,
2020b. Extrapolation of a structural equation model for digital soil mapping.
Geoderma 367, 114226. https://doi.org/10.1016/J.GEODERMA.2020.114226
Anzanello, M.J., Ortiz, R.S., Limbergerb, R.P., Mayorga, P., 2013. A multivariate-
based wavenumber selection method for classifying medicines into authentic or
counterfeit classes. J Pharm Biomed Anal 83, 209–214.
https://doi.org/10.1016/J.JPBA.2013.05.004
Bachmann, C.M., Philpot, W., Abelev, A., Korwan, D., 2014. Phase angle dependence
of sand density observable in hyperspectral reflectance. Remote Sens Environ
150, 53–65. https://doi.org/10.1016/J.RSE.2014.03.024
Bahia, A.S.R. de S., Marques, J., La Scala, N., Pellegrino Cerri, C.E., Camargo, L.A.,
2017a. Prediction and Mapping of Soil Attributes using Diffuse Reflectance
Spectroscopy and Magnetic Susceptibility. Soil Science Society of America
Journal 81, 1450–1462. https://doi.org/10.2136/sssaj2017.06.0206
Bahia, A.S.R. de S., Marques, J., la Scala, N., Pellegrino Cerri, C.E., Camargo, L.A.,
2017b. Prediction and Mapping of Soil Attributes using Diffuse Reflectance
Spectroscopy and Magnetic Susceptibility. Soil Science Society of America
Journal 81, 1450–1462. https://doi.org/10.2136/sssaj2017.06.0206
Bahia, A.S.R.D.S., Marques, J., Siqueira, D.S., 2015. Procedures using diffuse
reflectance spectroscopy for estimating hematite and goethite in Oxisols of São
Paulo, Brazil. Geoderma Regional 5, 150–156.
https://doi.org/10.1016/j.geodrs.2015.04.006
Baldo, D., Marques, J., Fernandes, K., de Almeida, G.M., Siqueira, D.S., 2021a. Soil
mineralogical attributes estimated by color as accessed by proximal sensors and
machine learning. Soil Science Society of America Journal 85, 2185–2200.
https://doi.org/10.1002/saj2.20309
Baldo, D., Marques, J., Fernandes, K., de Almeida, G.M., Siqueira, D.S., 2021b. Soil
mineralogical attributes estimated by color as accessed by proximal sensors and
machine learning. Soil Science Society of America Journal 85, 2185–2200.
https://doi.org/10.1002/saj2.20309
Balsam, W.L., Otto‐Bliesner, B.L., Deaton, B.C., 1995. Modern and Last Glacial
Maximum eolian sedimentation patterns in the Atlantic Ocean interpreted from
sediment iron oxide content. Paleoceanography 10, 493–507.
https://doi.org/10.1029/95PA00421
Baseca, C.C., Sendra, S., Lloret, J., Tomas, J., 2019. A smart decision system for
digital farming. Agronomy 9. https://doi.org/10.3390/agronomy9050216
Basu, D., Sinha, R., Sahu, S., Malla, J., Chakravorty, N., Ghosal, P.S., 2022.
Identification of severity and passive measurement of oxidative stress biomarkers
for β–thalassemia patients: K-means, random forest, XGBoost, decision tree,
neural network based novel framework. Advances in Redox Research 5, 100034.
https://doi.org/10.1016/J.ARRES.2022.100034
Bekker, G.F.H. van G., Addison, M., Addison, P., van Niekerk, A., 2019a. Using
machine learning to identify the geographical drivers of Ceratitis capitata trap
catch in an agricultural landscape. Comput Electron Agric 162, 582–592.
https://doi.org/10.1016/j.compag.2019.05.008
Bekker, G.F.H. van G., Addison, M., Addison, P., van Niekerk, A., 2019b. Using
machine learning to identify the geographical drivers of Ceratitis capitata trap
catch in an agricultural landscape. Comput Electron Agric 162, 582–592.
https://doi.org/10.1016/j.compag.2019.05.008
Borràs, E., Ferré, J., Boqué, R., Mestres, M., Aceña, L., Busto, O., 2015a. Data fusion
methodologies for food and beverage authentication and quality assessment - A
review. Anal Chim Acta 891, 1–14. https://doi.org/10.1016/j.aca.2015.04.042
114
Borràs, E., Ferré, J., Boqué, R., Mestres, M., Aceña, L., Busto, O., 2015b. Data fusion
methodologies for food and beverage authentication and quality assessment - A
review. Anal Chim Acta 891, 1–14. https://doi.org/10.1016/j.aca.2015.04.042
Bowden, C., Foster, T., Parkes, B., 2023. Identifying links between monsoon variability
and rice production in India through machine learning. Sci Rep 13, 1–12.
https://doi.org/10.1038/s41598-023-27752-8
Breiman, L., 2001. Random Forest. Mach Learn 45, 5–32.
https://doi.org/10.1017/CBO9781107415324.004
Breiman, Leo, 2001. Random forests. Mach Learn 45, 5–32.
https://doi.org/10.1023/A:1010933404324
Bui, D.T., Tsangaratos, P., Nguyen, V.T., Liem, N. Van, Trinh, P.T., 2020. Comparing
the prediction performance of a Deep Learning Neural Network model with
conventional machine learning models in landslide susceptibility assessment.
Catena (Amst) 188. https://doi.org/10.1016/j.catena.2019.104426
CAMARGO, O.A. de, MONIZ, A.C., JORGE, J.A.J., VALADARES, J.M.A.S., 1986.
Métodos de Análise Química, Mineralógica e Física de Solos do Instituto
Agronômico de Campinas, Boletim Técnico, 106. ed.
Camargo, L.A., Marques Júnior, J., Pereira, G.T., Horvat, R.A., 2009. Variabilidade
espacial de atributos mineralógicos de um Latossolo sob diferentes formas do
relevo. II - Correlação espacial entre mineralogia e agregados. Rev Bras Cienc
Solo 32, 2279–2288. https://doi.org/10.1590/s0100-06832008000600007
Cambule, A.H., Rossiter, D.G., Stoorvogel, J.J., 2013a. A methodology for digital soil
mapping in poorly-accessible areas. Geoderma 192, 341–353.
https://doi.org/10.1016/J.GEODERMA.2012.08.020
Cambule, A.H., Rossiter, D.G., Stoorvogel, J.J., 2013b. A methodology for digital soil
mapping in poorly-accessible areas. Geoderma 192, 341–353.
https://doi.org/10.1016/J.GEODERMA.2012.08.020
Camêlo, D. de L., Ker, J.C., Fontes, M.P.F., Corrêa, M.M., da Costa, A.C.S., Melo,
V.F., 2017. Pedogenic Iron Oxides in Iron-Rich Oxisols Developed from Mafic
Rocks. Rev Bras Cienc Solo 41.
https://doi.org/10.1590/18069657RBCS20160379
Canizo, B. V., Escudero, L.B., Pellerano, R.G., Wuilloud, R.G., 2019. Data mining
approach based on chemical composition of grape skin for quality evaluation and
traceability prediction of grapes. Comput Electron Agric 162, 514–522.
https://doi.org/10.1016/j.compag.2019.04.043
Canizo, B. v., Escudero, L.B., Pellerano, R.G., Wuilloud, R.G., 2019. Data mining
approach based on chemical composition of grape skin for quality evaluation and
traceability prediction of grapes. Comput Electron Agric 162, 514–522.
https://doi.org/10.1016/j.compag.2019.04.043
Chagas, C. da S., de Carvalho Junior, W., Bhering, S.B., Calderano Filho, B., 2016a.
Spatial prediction of soil surface texture in a semiarid region using random forest
and multiple linear regressions. Catena (Amst) 139, 232–240.
https://doi.org/10.1016/j.catena.2016.01.001
Chagas, C. da S., de Carvalho Junior, W., Bhering, S.B., Calderano Filho, B., 2016b.
Spatial prediction of soil surface texture in a semiarid region using random forest
and multiple linear regressions. Catena (Amst) 139, 232–240.
https://doi.org/10.1016/J.CATENA.2016.01.001
Chai, T., Draxler, R.R., 2014. Root mean square error (RMSE) or mean absolute error
(MAE)? -Arguments against avoiding RMSE in the literature. Geosci Model Dev
7, 1247–1250. https://doi.org/10.5194/gmd-7-1247-2014
Chen, T., Guestrin, C., 2016a. XGBoost: A scalable tree boosting system, in:
Proceedings of the ACM SIGKDD International Conference on Knowledge
115
Discovery and Data Mining. Association for Computing Machinery, pp. 785–794.
https://doi.org/10.1145/2939672.2939785
Chen, T., Guestrin, C., 2016b. XGBoost: A scalable tree boosting system. Proceedings
of the ACM SIGKDD International Conference on Knowledge Discovery and Data
Mining 13-17-August-2016, 785–794. https://doi.org/10.1145/2939672.2939785
Coblinski, J.A., Giasson, É., Demattê, J.A.M., Dotto, A.C., Costa, J.J.F., Vašát, R.,
2020. Prediction of soil texture classes through different wavelength regions of
reflectance spectroscopy at various soil depths. Catena (Amst) 189, 104485.
https://doi.org/10.1016/j.catena.2020.104485
Cornell, R.M., Schwertmann, U., 2006. The Iron Oxides: Structure, Properties,
Reactions, Occurrences and Uses 707.
da Costa, A.C.S., Junior, I.G. de S., Canton, L.C., Gil, L.G., Figueiredo, R., 2020.
Contribution of the chemical and mineralogical properties of sandy-loam tropical
soils to the cation exchange capacity. Rev Bras Cienc Solo 44, 1–18.
https://doi.org/10.36783/18069657rbcs20200019
de Castro, C.L., Braga, A.P., 2011. Aprendizado supervisionado com conjuntos de
dados desbalanceados. Sba: Controle & Automação Sociedade Brasileira de
Automatica 22, 441–466. https://doi.org/10.1590/S0103-17592011000500002
de Motomiya, A.V.A., Corá, J.E., Pereira, G.T., 2006. Uso da krigagem indicatriz na
avaliação de indicadores de fertilidade do solo. Rev Bras Cienc Solo 30, 485–496.
https://doi.org/10.1590/S0100-06832006000300010
Demattê, José Alexandre M, Dotto, A.C., Bedin, L.G., Sayão, V.M., Barros, A., 2019.
Geoderma Soil analytical quality control by traditional and spectroscopy
techniques : Constructing the future of a hybrid laboratory for low environmental
impact. Geoderma 337, 111–121.
https://doi.org/10.1016/j.geoderma.2018.09.010
Demattê, José A.M., Dotto, A.C., Paiva, A.F.S., Sato, M. V., Dalmolin, R.S.D., de
Araújo, M. do S.B., da Silva, E.B., Nanni, M.R., ten Caten, A., Noronha, N.C.,
Lacerda, M.P.C., de Araújo Filho, J.C., Rizzo, R., Bellinaso, H., Francelino, M.R.,
Schaefer, C.E.G.R., Vicente, L.E., dos Santos, U.J., de Sá Barretto Sampaio, E.
V., Menezes, R.S.C., de Souza, J.J.L.L., Abrahão, W.A.P., Coelho, R.M., Grego,
C.R., Lani, J.L., Fernandes, A.R., Gonçalves, D.A.M., Silva, S.H.G., de Menezes,
M.D., Curi, N., Couto, E.G., dos Anjos, L.H.C., Ceddia, M.B., Pinheiro, É.F.M.,
Grunwald, S., Vasques, G.M., Marques Júnior, J., da Silva, A.J., Barreto, M.C. de
V., Nóbrega, G.N., da Silva, M.Z., de Souza, S.F., Valladares, G.S., Viana, J.H.M.,
da Silva Terra, F., Horák-Terra, I., Fiorio, P.R., da Silva, R.C., Frade Júnior, E.F.,
Lima, R.H.C., Alba, J.M.F., de Souza Junior, V.S., Brefin, M.D.L.M.S., Ruivo,
M.D.L.P., Ferreira, T.O., Brait, M.A., Caetano, N.R., Bringhenti, I., de Sousa
Mendes, W., Safanelli, J.L., Guimarães, C.C.B., Poppiel, R.R., e Souza, A.B.,
Quesada, C.A., do Couto, H.T.Z., 2019. The Brazilian Soil Spectral Library
(BSSL): A general view, application and challenges. Geoderma 354, 113793.
https://doi.org/10.1016/j.geoderma.2019.05.043
Dietterich, T., 1995. Overfitting and undercomputing in machine learning. ACM
Computing Surveys (CSUR) 27, 326–327. https://doi.org/10.1145/212094.212114
dos Santos, F.R., de Oliveira, J.F., Barbosa, G.M.C., Melquiades, F.L., 2021.
Comparison between energy dispersive X-ray fluorescence spectral data and
elemental data for soil attributes modelling. Spectrochim Acta Part B At Spectrosc
185, 106303. https://doi.org/10.1016/J.SAB.2021.106303
Eberhardt, D.N., Vendrame, P.R.S., Becquer, T., De Fátima Guimarães, M., 2008a.
Influência da granulometria e da mineralogia sobre a retenção do fósforo em
latossolos sob pastagens no cerrado. Rev Bras Cienc Solo 32, 1009–1016.
https://doi.org/10.1590/s0100-06832008000300010
116
Eberhardt, D.N., Vendrame, P.R.S., Becquer, T., De Fátima Guimarães, M., 2008b.
Influência da granulometria e da mineralogia sobre a retenção do fósforo em
latossolos sob pastagens no cerrado. Rev Bras Cienc Solo 32, 1009–1016.
https://doi.org/10.1590/s0100-06832008000300010
Ebtehaj, I., Bonakdari, H., 2022. A reliable hybrid outlier robust non-tuned rapid
machine learning model for multi-step ahead flood forecasting in Quebec,
Canada. J Hydrol (Amst) 614, 128592.
https://doi.org/10.1016/J.JHYDROL.2022.128592
EMBRAPA, 2017. Manual de metodos de análises, in: Manual de Métodos de Análise
de Solo. Brasilia, DF, p. 574.
Esfandiarpour-Boroujeni, I., Shamsabadi, M.S., Shirani, H., Mosleh, Z., Bagheri
Bodaghabadi, M., Salehi, M.H., 2020. Comparison of error and uncertainty of
decision tree and learning vector quantization models for predicting soil classes in
areas with low altitude variations. Catena (Amst) 191, 104581.
https://doi.org/10.1016/J.CATENA.2020.104581
Fan, S.S., Chang, F.H., Hsueh, H.T., Ko, T.H., 2016. Measurement of Total Free Iron
in Soils by H2S Chemisorption and Comparison with the Citrate Bicarbonate
Dithionite Method. J Anal Methods Chem 2016.
https://doi.org/10.1155/2016/7213542
Faria, A.J.G. de, Silva, S.H.G., Andrade, R., Mancini, M., Melo, L.C.A., Weindorf, D.C.,
Guilherme, L.R.G., Curi, N., 2022. Prediction of soil organic matter content by
combining data from Nix ProTM color sensor and portable X-ray fluorescence
spectrometry in tropical soils. Geoderma Regional 28, e00461.
https://doi.org/10.1016/J.GEODRS.2021.E00461
Fernandes, L.A., Castro, A.B. de, Basilici, G., 2007. Seismites in continental sand sea
deposits of the Late Cretaceous Caiuá Desert , Bauru Basin, Brasil. Sediment
Geol 199, 61–64. https://doi.org/10.1016/j.sedgeo.2005.12.030
Fernandes, R.B.A., Barrón, V., Torrent, J., Fontes, M.P.F., 2004. Quantificação de
óxidos de ferro de Latossolos brasileiros por espectroscopia de refletância difusa.
Rev Bras Cienc Solo 28, 245–257. https://doi.org/10.1590/S0100-
06832004000200003
Fink, J.R., Inda, A. v., Bavaresco, J., Barrón, V., Torrent, J., Bayer, C., 2016.
Adsorption and desorption of phosphorus in subtropical soils as affected by
management system and mineralogy. Soil Tillage Res 155, 62–68.
https://doi.org/10.1016/J.STILL.2015.07.017
Fonseca, J. da S., Campos, M.C.C., Brito Filho, E.G. de, Mantovanelli, B.C., Silva,
L.S., de Lima, A.F.L., Da Cunha, J.M., Simões, E.L., dos Santos, L.A.C., 2021.
Soil–landscape relationship in a sandstone-gneiss topolithosequence in the State
of Amazonas, Brazil. Environ Earth Sci 80, 1–15. https://doi.org/10.1007/s12665-
021-10026-9
Ganaie, M.A., Tanveer, M., Suganthan, P.N., Snasel, V., 2022. Oblique and rotation
double random forest. Neural Networks 153, 496–517.
https://doi.org/10.1016/J.NEUNET.2022.06.012
Ghafarian, F., Wieland, R., Lüttschwager, D., Nendel, C., 2022. Application of extreme
gradient boosting and Shapley Additive explanations to predict temperature
regimes inside forests from standard open-field meteorological data.
Environmental Modelling & Software 156, 105466.
https://doi.org/10.1016/J.ENVSOFT.2022.105466
Gholizadeh, A., Luboš, B., Saberioon, M., Vašát, R., 2013. Visible, Near-Infrared, and
Mid-Infrared Spectroscopy Applications for Soil Assessment with Emphasis on
Soil Organic Matter Content and Quality: State-of-the-Art and Key Issues.
http://dx.doi.org/10.1366/13-07288 67, 1349–1362. https://doi.org/10.1366/13-
117
07288
Gholizadeh, A., Saberioon, M., Pouladi, N., Ben-Dor, E., 2023. Quantification and
depth distribution analysis of carbon to nitrogen ratio in forest soils using
reflectance spectroscopy. International Soil and Water Conservation Research 11,
112–124. https://doi.org/10.1016/J.ISWCR.2022.06.004
Goldshleger, N., Ben-Dor, E., Benyamini, Y., Agassi, M., 2004. SOIL REFLECTANCE
AS A TOOL FOR ASSESSING PHYSICAL CRUST ARRANGEMENT OF FOUR
TYPICAL SOILS IN ISRAEL. Soil Sci 169, 677–687.
https://doi.org/10.1097/01.ss.0000146024.61559.e2
Golkarian, A., Khosravi, K., Panahi, M., Clague, J.J., 2023. Spatial variability of soil
water erosion: Comparing empirical and intelligent techniques. Geoscience
Frontiers 14, 101456. https://doi.org/10.1016/J.GSF.2022.101456
Gómez-Escalonilla, Diancoumba, O., Traoré, D.Y., Montero, E., Martín-Loeches, M.,
Martínez-Santos, P., 2022. Multiclass spatial predictions of borehole yield in
southern Mali by means of machine learning classifiers. J Hydrol Reg Stud 44,
101245. https://doi.org/10.1016/J.EJRH.2022.101245
Gray, J.M., Bishop, T.F.A., Wilford, J.R., 2016. Lithology and soil relationships for soil
modelling and mapping. Catena (Amst) 147, 429–440.
https://doi.org/10.1016/j.catena.2016.07.045
Grunwald, S., Vasques, G.M., Rivero, R.G., 2015. Fusion of Soil and Remote Sensing
Data to Model Soil Properties. Advances in Agronomy 131, 1–109.
https://doi.org/10.1016/BS.AGRON.2014.12.004
Hall, D.L., Llinas, J., 2016. An introduction to multi-sensor data fusion. Sensors,
Nanoscience, Biomedical Engineering, and Instruments 85.
Han, L., Yang, G., Yang, X., Song, X., Xu, B., Li, Z., Wu, Jintao, Yang, H., Wu, Jianwei,
2022. An explainable XGBoost model improved by SMOTE-ENN technique for
maize lodging detection based on multi-source unmanned aerial vehicle images.
Comput Electron Agric 194, 106804.
https://doi.org/10.1016/J.COMPAG.2022.106804
He, M., Tang, L., Li, C., Ren, J., Zhang, L., Li, X., 2022. Dynamics of soil organic carbon
and nitrogen and their relations to hydrothermal variability in dryland. J Environ
Manage 319, 115751. https://doi.org/10.1016/J.JENVMAN.2022.115751
Heuvelink, G.B.M., Brus, D.J., Rossiter, D.G., Shi, Z., 2019. Editorial for pedometrics
2017 special issue. Eur J Soil Sci 70, 25–26. https://doi.org/10.1111/ejss.12772
Hikouei, I.S., Kim, S.S., Mishra, D.R., 2021. Machine-learning classification of soil bulk
density in salt marsh environments. Sensors 21.
https://doi.org/10.3390/s21134408
Holmgren, G.G.S., 1967a. A Rapid Citrate-Dithionite Extractable Iron Procedure. Soil
Science Society of America Journal 31, 210–211.
https://doi.org/10.2136/sssaj1967.03615995003100020020x
Holmgren, G.G.S., 1967b. A Rapid Citrate-Dithionite Extractable Iron Procedure. Soil
Science Society of America Journal 31, 210–211.
https://doi.org/10.2136/sssaj1967.03615995003100020020x
Hong, H., Ji, K., Hei, H., Wang, C., Liu, C., Zhao, L., Lanson, B., Zhao, C., Fang, Q.,
Algeo, T.J., 2023. Clay mineral evolution and formation of intermediate phases
during pedogenesis on picrite basalt bedrock under temperate conditions
(Yunnan, southwestern China). Catena (Amst) 220, 106677.
https://doi.org/10.1016/J.CATENA.2022.106677
Isaaks, E.H., Srivastava, R.M., 1989. An Introduction to Applied Geostatistics,
Computers & Geosciences. Pergamon. https://doi.org/10.1016/0098-
3004(91)90055-I
Jararweh, Y., Fatima, S., Jarrah, M., AlZu’bi, S., 2023. Smart and sustainable
118
Shi, T., 2022. Digital mapping of soil organic carbon density using newly
developed bare soil spectral indices and deep neural network. Catena (Amst) 219,
106603. https://doi.org/10.1016/J.CATENA.2022.106603
Liu, X., Zhu, A.X., Yang, L., Pei, T., Liu, J., Zeng, C., Wang, D., 2020. A graded
proportion method of training sample selection for updating conventional soil
maps. Geoderma 357, 113939. https://doi.org/10.1016/j.geoderma.2019.113939
Lorz, C., Fruhauf, M., Mailander, R., Phillips, J.D., Kleber, A., 2013. Influence of Cover
Beds on Soils, Mid-Latitude Slope Deposits (Cover Beds).
Lu, W.N., He, Y., Wang (王阳), Y., Ke, S., 2020. Behavior of calcium isotopes during
continental subduction recorded in meta-basaltic rocks. Geochim Cosmochim
Acta 278, 392–404. https://doi.org/10.1016/J.GCA.2019.09.027
Ma, G., Ding, J., Han, L., Zhang, Z., Ran, S., 2021. Digital mapping of soil salinization
based on Sentinel-1 and Sentinel-2 data combined with machine learning
algorithms. Regional Sustainability 2, 177–188.
https://doi.org/10.1016/J.REGSUS.2021.06.001
Malone, B.P., Jha, S.K., Minasny, B., McBratney, A.B., 2016. Comparing regression-
based digital soil mapping and multiple-point geostatistics for the spatial
extrapolation of soil data. Geoderma 262, 243–253.
https://doi.org/10.1016/J.GEODERMA.2015.08.037
Mancini, M., Andrade, R., Teixeira, A.F. dos S., Silva, S.H.G., Weindorf, D.C.,
Chakraborty, S., Guilherme, L.R.G., Curi, N., 2022. Proximal sensor data fusion
for Brazilian soil properties prediction: Exchangeable/available macronutrients,
aluminum, and potential acidity. Geoderma Regional 30, e00573.
https://doi.org/10.1016/J.GEODRS.2022.E00573
Marques, J., Siqueira, D.S., Camargo, L.A., Teixeira, D.D.B., Barrón, V., Torrent, J.,
2014. Magnetic susceptibility and diffuse reflectance spectroscopy to characterize
the spatial variability of soil properties in a brazilian haplustalf. Geoderma 219–
220, 63–71. https://doi.org/10.1016/j.geoderma.2013.12.007
Maurya, A.K., Bhargava, N., Singh, D., 2022a. Efficient selection of SAR features using
ML based algorithms for accurate FVC estimation. Advances in Space Research
70, 1795–1809. https://doi.org/10.1016/J.ASR.2022.06.039
Maurya, A.K., Bhargava, N., Singh, D., 2022b. Efficient selection of SAR features using
ML based algorithms for accurate FVC estimation. Advances in Space Research
70, 1795–1809. https://doi.org/10.1016/J.ASR.2022.06.039
McBratney, A., Gruijter, J., Bryce, A., 2019. Pedometrics timeline. Geoderma 338,
568–575. https://doi.org/10.1016/j.geoderma.2018.11.048
McBratney, A.B., Mendonça Santos, M.L., Minasny, B., 2003. On digital soil mapping,
Geoderma. https://doi.org/10.1016/S0016-7061(03)00223-4
McKeague, J.A., Day, J.H., 1966. DITHIONITE- AND OXALATE-EXTRACTABLE Fe
AND Al AS AIDS IN DIFFERENTIATING VARIOUS CLASSES OF SOILS. Can J
Soil Sci 46, 13–22. https://doi.org/10.4141/cjss66-003
Mehra, O.P., Jackson, M.L., 1958. Iron Oxide Removal from Soils and Clays by a
Dithionite-Citrate System Buffered with Sodium Bicarbonate. Clays and Clay
Minerals 1958 7:1 7, 317–327. https://doi.org/10.1346/CCMN.1958.0070122
Mello, F.A.O., Bellinaso, H., Mello, D.C., Safanelli, J.L., Mendes, W.D.S., Amorim,
M.T.A., Gomez, A.M.R., Poppiel, R.R., Silvero, N.E.Q., Gholizadeh, A., Silva,
S.H.G., Curi, N., Demattê, J.A.M., 2021. Soil parent material prediction through
satellite multispectral analysis on a regional scale at the Western Paulista Plateau,
Brazil. Geoderma Regional 26, e00412.
https://doi.org/10.1016/J.GEODRS.2021.E00412
Mendes, W. de S., Demattê, J.A.M., Bonfatti, B.R., Resende, M.E.B., Campos, L.R.,
Costa, A.C.S. da, 2021. A novel framework to estimate soil mineralogy using soil
120
N.B., Guo, W., Ngo, H.H., 2022a. A novel intelligence approach based active and
ensemble learning for agricultural soil organic carbon prediction using
multispectral and SAR data fusion. Science of the Total Environment 804.
https://doi.org/10.1016/j.scitotenv.2021.150187
Nguyen, T.T., Pham, T.D., Nguyen, C.T., Delfos, J., Archibald, R., Dang, K.B., Hoang,
N.B., Guo, W., Ngo, H.H., 2022b. A novel intelligence approach based active and
ensemble learning for agricultural soil organic carbon prediction using
multispectral and SAR data fusion. Science of The Total Environment 804,
150187. https://doi.org/10.1016/J.SCITOTENV.2021.150187
Nocita, M., Stevens, A., van Wesemael, B., Aitkenhead, M., Bachmann, M., Barthès,
B., Dor, E. Ben, Brown, D.J., Clairotte, M., Csorba, A., Dardenne, P., Demattê,
J.A.M., Genot, V., Guerrero, C., Knadel, M., Montanarella, L., Noon, C., Ramirez-
Lopez, L., Robertson, J., Sakai, H., Soriano-Disla, J.M., Shepherd, K.D.,
Stenberg, B., Towett, E.K., Vargas, R., Wetterlind, J., 2015. Soil Spectroscopy:
An Alternative to Wet Chemistry for Soil Monitoring. Advances in Agronomy 132,
139–159. https://doi.org/10.1016/bs.agron.2015.02.002
Norrish, K., Taylor, R.M., 1961. The isomorphous replacement of iron by aluminium in
soil goethites. Journal of Soil Science 12, 294–306.
https://doi.org/10.1111/J.1365-2389.1961.TB00919.X
Novais, R.F., Alvarez V., V.H.;, Barros, N.F. de;, Fontes, R.L.F.;, Cantarutti, R.B.;,
Neves, J.C.L., 2007. Fertilidade do solo. Viçosa.
Nowak-Brzezinska, A., Horyn, C., 2020. Outliers in rules - the comparision of LOF,
COF and KMEANS algorithms. Procedia Comput Sci 176, 1420–1429.
https://doi.org/10.1016/J.PROCS.2020.09.152
Oliveira, C. v., Ker, J.C., Fontes, L.E.F., Curi, N., Pinheiro, J.C., 1998. Química e
mineralogia de solos derivados de rochas do Grupo Bambuí no norte de Minas
Gerais. Rev Bras Cienc Solo 22, 583–593. https://doi.org/10.1590/S0100-
06831998000400003
Oliver, M.A., Webster, R., 2014a. A tutorial guide to geostatistics: Computing and
modelling variograms and kriging. Catena (Amst) 113, 56–69.
https://doi.org/10.1016/J.CATENA.2013.09.006
Oliver, M.A., Webster, R., 2014b. A tutorial guide to geostatistics: Computing and
modelling variograms and kriging. Catena (Amst) 113, 56–69.
https://doi.org/10.1016/j.catena.2013.09.006
Padarian, J., Minasny, B., McBratney, A.B., 2019. Using deep learning to predict soil
properties from regional spectral data. Geoderma Regional 16.
https://doi.org/10.1016/j.geodrs.2018.e00198
Pedregosa, F., Michel, V., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R.,
Vanderplas, J., Cournapeau, D., Pedregosa, F., Varoquaux, G., Gramfort, A.,
Thirion, B., Grisel, O., Dubourg, V., Passos, A., Brucher, M., 2011. Scikit-learn:
Machine Learning in Python. The Journal of Machine Learning Research 12,
2825–2830. https://doi.org/10.5555/1953048.2078195
Pedron, F. de A., Lourenzi, C.R., Ceretta, C.A., Lorensi, J., Cancian, A., 2018. Clay
mineralogy of subtropical soils under long-term organic fertilization in no-tillage
systems. Rev Bras Cienc Solo 42.
https://doi.org/10.1590/18069657rbcs20170092
Ramaroson, V.H., Becquer, T., Sá, S.O., Razafimahatratra, H., Delarivière, J.L.,
Blavet, D., Vendrame, P.R.S., Rabeharisoa, L., Rakotondrazafy, A.F.M., 2018.
Mineralogical analysis of ferralitic soils in Madagascar using NIR spectroscopy.
Catena (Amst) 168, 102–109. https://doi.org/10.1016/j.catena.2017.07.016
Reda, R., Saffaj, T., Ilham, B., Saidi, O., Issam, K., Brahim, L., El Hadrami, E.M., 2019.
A comparative study between a new method and other machine learning
122
algorithms for soil organic carbon and total nitrogen prediction using near infrared
spectroscopy. Chemometrics and Intelligent Laboratory Systems 195.
https://doi.org/10.1016/j.chemolab.2019.103873
Rennert, T., 2019. Wet-chemical extractions to characterise pedogenic Al and Fe
species-a critical review. Soil Research 57, 1–16.
https://doi.org/10.1071/SR18299
Rosin, N.A., Demattê, J.A.M., Leite, M.C.A., de Carvalho, H.W.P., Costa, A.C.,
Greschuk, L.T., Curi, N., Silva, S.H.G., 2022. The fundamental of the effects of
water, organic matter, and iron forms on the pXRF information in soil analyses.
Catena (Amst) 210. https://doi.org/10.1016/j.catena.2021.105868
Rossiter, D.G., 2018. Past, present & future of information technology in pedometrics.
Geoderma 324, 131–137. https://doi.org/10.1016/j.geoderma.2018.03.009
Ruhollah, T.-M., Sheikhpour, R., Zeraatpisheh, M., Amirian-Chakan, A., Toomanian,
N., Kerry, R., Scholten, T., 2022a. Semi-supervised learning for the spatial
extrapolation of soil information. Geoderma 426, 116094.
https://doi.org/10.1016/J.GEODERMA.2022.116094
Ruhollah, T.-M., Sheikhpour, R., Zeraatpisheh, M., Amirian-Chakan, A., Toomanian,
N., Kerry, R., Scholten, T., 2022b. Semi-supervised learning for the spatial
extrapolation of soil information. Geoderma 426, 116094.
https://doi.org/10.1016/J.GEODERMA.2022.116094
Ruiz, H.A., Ferreira, G.B., Pereira, J.B.M., Resumo, ), 2003. Estimativa da capacidade
de campo de Latossolos e Neossolos Quartzarênicos pela determinação do
equivalente de umidade. Rev Bras Cienc Solo 27, 389–393.
https://doi.org/10.1590/S0100-06832003000200019
Santos, H.G. dos, Jacomine, P.K.T., Anjos, L.H.C. dos, Oliveira, V.Á. de, Lumbreras,
J.F., Coelho, M.R., Almeida, J.A. de, Filho, J.C. de A., Oliveira, J.B. de, Cunha,
T.J.F., 2018. Sistema brasileiro de classificação de solos, 5th ed, Embrapa Solos.
Embrapa, Brasilia.
Sarfraz, S., Ali, F., Hameed, A., Ahmad, Z., Riaz, K., 2023. Sustainable Agriculture
Through Technological Innovations. Sustainable Agriculture in the Era of the
OMICs Revolution 223–239. https://doi.org/10.1007/978-3-031-15568-0_10
Schwertmann, U., Taylor, R.M., 2018. Iron oxides. Minerals in Soil Environments 379–
438. https://doi.org/10.2136/sssabookser1.2ed.c8
Shahhosseini, M., Hu, G., Huber, I., Archontoulis, S. V., 2021. Coupling machine
learning and crop modeling improves crop yield prediction in the US Corn Belt. Sci
Rep 11, 1–15. https://doi.org/10.1038/s41598-020-80820-1
Shrestha, G., Calvelo-Pereira, R., Roudier, P., Martin, A.P., Turnbull, R.E., Kereszturi,
G., Jeyakumar, P., Anderson, C.W.N., 2022. Quantification of multiple soil trace
elements by combining portable X-ray fluorescence and reflectance spectroscopy.
Geoderma 409, 115649. https://doi.org/10.1016/J.GEODERMA.2021.115649
Silva, F.M., Silva, S.H.G., Acuña-Guzman, S.F., Silva, E.A., Ribeiro, B.T., Fruett, T.,
Inda, A.V., Teixeira, A.F. dos S., Mancini, M., Guilherme, L.R.G., Curi, N., 2021.
Chemical and mineralogical changes in the textural fractions of quartzite-derived
tropical soils, along weathering, assessed by portable X-ray fluorescence
spectrometry and X-ray diffraction. J South Am Earth Sci 112, 103634.
https://doi.org/10.1016/J.JSAMES.2021.103634
Silva, F.M., Silva, S.H.G., Teixeira, A.F. dos S., Inda, A.V., Fruett, T., Weindorf, D.C.,
Guilherme, L.R.G., Curi, N., 2022a. Using proximal sensors to assess
pedogenetic development of Inceptisols and Oxisols in Brazil. Geoderma Regional
28, 1–10. https://doi.org/10.1016/j.geodrs.2021.e00465
Silva, F.M., Silva, S.H.G., Teixeira, A.F. dos S., Inda, A.V., Fruett, T., Weindorf, D.C.,
Guilherme, L.R.G., Curi, N., 2022b. Using proximal sensors to assess
123
S.H.G., Ribeiro, B.T., Curi, N., Ray, D.P., 2022. Using Nix color sensor and
Munsell soil color variables to classify contrasting soil types and predict soil
organic carbon in Eastern India. Comput Electron Agric 199, 107192.
https://doi.org/10.1016/J.COMPAG.2022.107192
Tabatabai, S., Knadel, M., Thomsen, A., Greve, M.H., 2019. On-the-Go Sensor Fusion
for Prediction of Clay and Organic Carbon Using Pre-processing Survey, Different
Validation Methods, and Variable Selection. Soil Science Society of America
Journal 83, 300–310. https://doi.org/10.2136/SSSAJ2018.10.0377
Takoutsing, B., Heuvelink, G.B.M., 2022. Comparing the prediction performance,
uncertainty quantification and extrapolation potential of regression kriging and
random forest while accounting for soil measurement errors. Geoderma 428,
116192. https://doi.org/10.1016/J.GEODERMA.2022.116192
Teixeira, A.F. dos S., Andrade, R., Mancini, M., Silva, S.H.G., Weindorf, D.C.,
Chakraborty, S., Guilherme, L.R.G., Curi, N., 2022. Proximal sensor data fusion
for tropical soil property prediction: Soil fertility properties. J South Am Earth Sci
116, 103873. https://doi.org/10.1016/J.JSAMES.2022.103873
Teixeira, A.F. dos S., Henrique Procópio Pelegrino, M., Missina Faria, W., Henrique
Godinho Silva, S., Gabriela Marcolino Gonçalves, M., Weimar Acerbi Júnior, F.,
Rezende Gomide, L., Linares Pádua Júnior, A., de Souza, I.A., Chakraborty, S.,
Weindorf, D.C., Roberto Guimarães Guilherme, L., Curi, N., 2020. Tropical soil pH
and sorption complex prediction via portable X-ray fluorescence spectrometry.
Geoderma 361, 114132. https://doi.org/10.1016/j.geoderma.2019.114132
Teixeira, R.S., Vendrame, P.R.S., Christoni, A.R.F., SILVA, P.R.C., 2016. QUÍMICA E
MINERALOGIA DE UM SOLO DESENVOLVIDO DE BASALTO, COLETADO
ATRAVÉS DE SONDAGEM SPT. Boletim de Geografia 34, 116–126.
https://doi.org/10.4025/bolgeogr.v34i2.28948
Temme, A.J.A.M., Veldkamp, A., 2009. Multi-process Late Quaternary landscape
evolution modelling reveals lags in climate response over small spatial scales.
Earth Surf Process Landf 34, 573–589. https://doi.org/10.1002/ESP.1758
ten Caten, A., Dalmolin, R.S.D., Pedron, F. de A., Santos, M. de L.M., 2011a.
Extrapolação das relações solo-paisagem a partir de uma área de referência.
Ciência Rural 41, 812–816. https://doi.org/10.1590/S0103-84782011000500012
ten Caten, A., Dalmolin, R.S.D., Pedron, F. de A., Santos, M. de L.M., 2011b.
Extrapolação das relações solo-paisagem a partir de uma área de referência.
Ciência Rural 41, 812–816. https://doi.org/10.1590/S0103-84782011000500012
Thompson, J.A., Roecker, S., Grunwald, S., Owens, P.R., 2012. Digital Soil Mapping:
Interactions with and Applications for Hydropedology, in: Hydropedology. Elsevier,
pp. 665–709. https://doi.org/10.1016/B978-0-12-386941-8.00021-6
Thornthwaite, C.W., 1948. An Approach toward a Rational Classification of Climate
Author ( s ): C . W . Thornthwaite Published by : American Geographical Society
Stable URL : http://www.jstor.org/stable/210739 Accessed : 11-08-2016 18 : 02
UTC. Geogr Rev 38, 55–94. https://doi.org/10.2307/210739
Tsakiridis, N.L., Keramaris, K.D., Theocharis, J.B., Zalidis, G.C., 2020. Simultaneous
prediction of soil properties from VNIR-SWIR spectra using a localized multi-
channel 1-D convolutional neural network. Geoderma 367.
https://doi.org/10.1016/j.geoderma.2020.114208
Vasques, G.M., Rodrigues, H.M., Coelho, M.R., Baca, J.F.M., Dart, R.O., Oliveira,
R.P., Teixeira, W.G., Ceddia, M.B., 2020. Field Proximal Soil Sensor Fusion for
Improving High-Resolution Soil Property Maps. Soil Systems 2020, Vol. 4, Page
52 4, 52. https://doi.org/10.3390/SOILSYSTEMS4030052
Vieira, S.R., 2000. Geoestatística em estudos de variabilidade espacial do solo. , in:
R.F. Novais, V.H.A.G.R.S. (Ed.), Tópicos Em Ciência Do Solo. Viçosa, pp. 1–54.
125
Wang, J.H., Jiang, J.H., Yu, R.Q., 1996. Robust back propagation algorithm as a
chemometric tool to prevent the overfitting to outliers. Chemometrics and
Intelligent Laboratory Systems 34, 109–115. https://doi.org/10.1016/0169-
7439(96)00005-6
Wang, S., Peng, H., Hu, Q., Jiang, M., 2022. Analysis of runoff generation driving
factors based on hydrological model and interpretable machine learning method.
J Hydrol Reg Stud 42, 101139. https://doi.org/10.1016/J.EJRH.2022.101139
Weindorf, D.C., Bakr, N., Zhu, Y., 2014a. Advances in portable X-ray fluorescence
(PXRF) for environmental, pedological, and agronomic applications, Advances in
Agronomy. Elsevier. https://doi.org/10.1016/B978-0-12-802139-2.00001-9
Weindorf, D.C., Bakr, N., Zhu, Y., 2014b. Advances in portable X-ray fluorescence
(PXRF) for environmental, pedological, and agronomic applications, in: Advances
in Agronomy. Academic Press Inc., pp. 1–45. https://doi.org/10.1016/B978-0-12-
802139-2.00001-9
Weindorf, D.C., Paulette, L., Man, T., 2013. In-situ assessment of metal contamination
via portable X-ray fluorescence spectroscopy: Zlatna, Romania. Environmental
Pollution 182, 92–100. https://doi.org/10.1016/j.envpol.2013.07.008
Whittig, L.D., 1965. X-Ray Diffraction Techniques for Mineral Identification and
Mineralogical Composition. Methods of Soil Analysis, Part 1: Physical and
Mineralogical Properties, Including Statistics of Measurement and Sampling 671–
698. https://doi.org/10.2134/AGRONMONOGR9.1.C49
Xu, D., Chen, S., Xu, H., Wang, N., Zhou, Y., Shi, Z., 2020. Data fusion for the
measurement of potentially toxic elements in soil using portable spectrometers.
Environmental Pollution 263, 114649.
https://doi.org/10.1016/J.ENVPOL.2020.114649
Xu, D., Zhao, R., Li, S., Chen, S., Jiang, Q., Zhou, L., Shi, Z., 2019. Multi-sensor fusion
for the determination of several soil properties in the Yangtze River Delta, China.
Eur J Soil Sci 70, 162–173. https://doi.org/10.1111/EJSS.12729
Xu, G., Fan, H., Oliver, D.M., Dai, Y., Li, H., Shi, Y., Long, H., Xiong, K., Zhao, Z., 2022.
Decoding river pollution trends and their landscape determinants in an ecologically
fragile karst basin using a machine learning model. Environ Res 214, 113843.
https://doi.org/10.1016/J.ENVRES.2022.113843
Xu, S., Zhao, Y., Wang, M., Shi, X., 2018. Quantification of Different Forms of Iron from
Intact Soil Cores of Paddy Fields with Vis-NIR Spectroscopy. Soil Science Society
of America Journal 82, 1497–1511. https://doi.org/10.2136/SSSAJ2018.01.0014
Yan, F., Shangguan, W., Zhang, J., Hu, B., 2020a. Depth-to-bedrock map of China at
a spatial resolution of 100 meters. Sci Data 7, 1–13.
https://doi.org/10.1038/s41597-019-0345-6
Yan, F., Shangguan, W., Zhang, J., Hu, B., 2020b. Depth-to-bedrock map of China at
a spatial resolution of 100 meters. Scientific Data 2020 7:1 7, 1–13.
https://doi.org/10.1038/s41597-019-0345-6
Ye, M., Zhu, L., Li, X., Ke, Y., Huang, Y., Chen, B., Yu, H., Li, H., Feng, H., 2023.
Estimation of the soil arsenic concentration using a geographically weighted
XGBoost model based on hyperspectral data. Science of The Total Environment
858, 159798. https://doi.org/10.1016/J.SCITOTENV.2022.159798
Zanotti, C., Rotiroti, M., Sterlacchini, S., Cappellini, G., Fumagalli, L., Stefania, G.A.,
Nannucci, M.S., Leoni, B., Bonomi, T., 2019. Choosing between linear and
nonlinear models and avoiding overfitting for short and long term groundwater
level forecasting in a linear system. J Hydrol (Amst) 578, 124015.
https://doi.org/10.1016/J.JHYDROL.2019.124015
Zeraatpisheh, M., Ayoubi, S., Jafari, A., Finke, P., 2017. Comparing the efficiency of
digital and conventional soil mapping to predict soil types in a semi-arid region in
126