Memoire Final Dany
Memoire Final Dany
Memoire Final Dany
REPUBLIC OF CAMEROON
Paix -Travail - Patrie
Peace - Work - Fatherland
---------
UNIVERSITE DE NGAOUNDERE
THE UNIVERSITY OF NGAOUNDERE
---------
ECOLE DE GEOLOGIE ET D’EXPLOITATION
MINIERE
SCHOOL OF GEOLOGY AND MINING
ENGINEERING
---------
Sur le thème :
Sous l’encadrement de :
i
REMERCIEMENTS
Ce mémoire en géologie minière option géostatistique appliquée à l’industrie minière
marque une étape très importante dans ma vie couronnant la fin de ma formation en ingénierie
minière ; je voudrais remercier ici les personnes qui m’ont accompagnée au cours de mon
parcours, et qui ont participé de près ou de loin à la réalisation de ce projet. Mes pensées sont
particulièrement conduites vers :
Dieu le Père Tout Puissant pour son très grand Amour depuis ma conception jusqu’à
lors ;
Le Pr Abdoul WAHABOU, Directeur de l’Ecole de Géologie et d’Exploitation Minière
de Meiganga (EGEM), pour les efforts entrepris pour que la fin de notre cursus académique à
l’Ecole de Géologie et d’Exploitation Minière puisse se passer sans problèmes ;
Le Pr. NGOUNOUNO Ismaïla, Directeur de l’Ecole de Géologie et d’Exploitation
Minière de Meiganga de sa création jusqu’en 2019 et initiateur de la spécialité Géostatistique
dans ladite école, pour tous les efforts consentis dans le cadre de notre formation ;
Mon encadrant Pr. MEYING Arsène, pour son encadrement, sa bonne humeur, la
disponibilité dont il fait preuve à mon endroit, pour son assistance et précieux conseils qu’il a
bien voulus me prodiguer durant la rédaction de ce mémoire ;
Ingénieur BOROH William pour sa disponibilité, sa rigueur au travail pendant la
rédaction de ce mémoire et les connaissances transmises durant ma spécialisation ;
Les enseignants de l’Ecole de Géologie et d’Exploitation Minière de Meiganga et
particulièrement mes enseignants de spécialité : Dr. MFENJOU Martin, M. MBOUNJA
Fritz, Ingénieur NJIKAM Souleyman, Ingénieur EKOLLE Franklin, Ingénieur
MOUKETE qui se sont donnés corps et âme pour que nous puissions arriver à cette étape de
notre formation à l’aide de toutes les connaissances qu’ils ont bien voulues nous dispensées ;
Mon ainé académique, Ingénieur ZO’OMBO Yvan pour sa gentillesse et sa
disponibilité permanente lorsque je sollicitais son aide par rapport à la rédaction de ce mémoire.
Ma grand-mère TCHUENDEM Denise pour sa douceur, ses prières pour moi, ses
précieux conseils ainsi que sa chaleureuse hospitalité durant les moments que je passe auprès
d’elle.
Ma tante Mme KEUMEUGNE Minette et son époux M. KEUMEUGNE Emmanuel
ainsi que leurs enfants pour leur chaleureux accueil dès mon arrivée dans la ville de Meiganga,
leur hospitalité et pour tous les moments de joie passés ensemble ;
ii
Mes tantes et oncles ; MAYOUDOM Jacqueline, NGUETANG Marceline, SIMO
Chancelline, BOUTCHANG Joël, WAKAM Landry pour leurs permanents précieux
conseils, leur soutien durant toute ma formation ;
Mes frères et sœurs SIMEU Stéphanie, DJUIDJE Alice Laure, WADJOM Claude
KAMGAING Loïc, TCHINDJO Franck, KAMDEM Jordan, YIMDJO Brenda,
TCHEPANOU Arthur, KAMFING Elvira et TCHUENDEM Rose pour leur amour
inconditionnel et leur présence dans ma vie.
La communauté chrétienne de l’Eglise Evangélique du Cameroun (EEC) de Meiganga
et son pasteur NKOUINDJA Emmanuel pour les chaleureux moments de prières,
d’enseignement et de louange passés ensemble durant mes cinq années de formation ;
L’Association des Elèves et Etudiants de l’Ouest à Meiganga (AEEOM) pour tous les
moments de divertissement, de joie et de convivialité partagés ainsi que les projets montés et
réalisés ensemble ;
Mes cadets académiques NDEZO Carole, KENNE Geric et TAKOUDOUM Julie pour
leur esprit comique, leur disponibilité, leur soutien durant ma formation et pendant la période
de rédaction de ce mémoire ;
Mes camarades de promotion, spécialement ceux de spécialité : PAGUI Sonia,
TCHINDOUM Eric, ABBA MADI Stéphane, NGUELE Ruphin, BAKONGA KAME
Christian, NGAMBO Stella Grace, TCHOFFO Berthol, OUANDJI Rudi, MEDAM
Tyfanie, FOTSAP Mylène, MOUAKEM Florette et SORE Yvan pour la forte solidarité
qu’ensemble nous avons pu développer durant ces cinq ans de formation, pour les moments de
dur labeur et de joie folle passés ensemble ;
Mon ami et camarade de promotion MAY Thierry pour sa gentillesse, son savoir-être et
son savoir-faire qu’il a toujours mis à ma disponibilité durant toute ma formation et la période
de rédaction de ce mémoire ;
Mes amis : NYAMSI TCHOUA Adrielle, BIDJOGO MVOGO Pascal, NSIANGET
Danielle pour leur amour et leur présence perpétuelle dans les bons et mauvais moments ;
Enfin j’adresse un dernier remerciement à mon compagnon de tous les jours Ingénieur.
GNITEDEM NGUEDIE Jack-Brice pour son soutien perpétuel dans les épreuves que je
traverse au quotidien et de qui je reçois le maximum de critiques constructives afin de donner
le meilleur de moi-même dans tout ce que j’entreprends.
iii
LISTE DES SIGLES ET ABREVIATIONS
2D : Deux Dimensions
CART : Classification And Regression Trees
Cov : covariance
Cu : Cuivre
ccp : Cost-Complexity Pruning
ENE : Est Nord Est
F : Roche Felsique
Fgd : Granodiorite
FP : Roche Felsique Porphirique
Hg : Mercure
IA : Intelligence Artificielle
Id : Diorite
KO : Krigeage Ordinaire
LOOCV : Leave-One-Out Cross-Validation
Mam : amphibolite
Mo : Molybdène
Msc : Schiste mafique
NE : Nord-Est
NNW : Nord-Nord Weast
OOB : out-of-bag
Pb : Plomb
PVM : Parallel Virtual Machine
PyPI : Python Pip
RF : Random Forest
SSW : South South West
UMM : Unité Minière Mimale
Zn : Zinc
𝛾(h) : Semivariogramme avec un pas h
iv
LISTE DES FIGURES
Figure 1: Carte de localisation de Bibemi (D) ; Carte de la région du Nord montrant
l’arrondissement de Bibemi(C) ; Carte du Cameroun montrant la région du Nord(B) ; Carte de
l’Afrique montrant le Cameroun(A) (Base de données SOGEFI, 2016) .................................. 4
Figure 2: Diagramme climatique............................................................................................... 5
Figure 3: Courbe des températures ............................................................................................ 6
Figure 4: Carte morphologique de Bibemi ................................................................................ 7
Figure 5: Réseau hydrographique de Bibemi ............................................................................ 8
Figure 6: Carte géologique de Bibemi (Mey, et al., 2020) ...................................................... 10
Figure 7: Ordinateur portable .................................................................................................. 15
Figure 8: Clé internet ............................................................................................................... 15
Figure 9: Modèle de variogramme sphérique (Emery, 2001) ................................................. 20
Figure 10: Modèle de variogramme exponentiel (Emery, 2001) ............................................ 20
Figure 11: Mise en œuvre du krigeage ordinaire (Matheron, 1970) ....................................... 24
Figure 12: Log lithologique tranchée 1 ................................................................................... 30
Figure 13: Log lithologique tranchée 2 ................................................................................... 31
Figure 14: Histogramme tranchée 1 ........................................................................................ 34
Figure 15: Histogramme tranchée 2 ........................................................................................ 35
Figure 16 : Fonction de répartition des épaisseurs tranchée 1 ................................................ 36
Figure 17: Fonction de répartition des épaisseurs tranchée 2 ................................................. 36
Figure 18: Histogramme des données normalisées tranchée 1 ............................................... 37
Figure 19: Histogramme des données normalisées tranchée 2 ............................................... 37
Figure 20 : Carte variographique tranchée 1 ........................................................................... 38
Figure 21: Carte variographique tranchée 2 ............................................................................ 39
Figure 22 : Variogramme des épaisseurs tranchée 1 ............................................................... 40
Figure 23: Vagriogramme des épaisseurs tranchée 2 .............................................................. 40
Figure 24: Grille tranchée 1..................................................................................................... 42
Figure 25: Grille tranchée 2..................................................................................................... 42
Figure 26: Carte de prédiction par KO, tranchée 1 ................................................................. 43
Figure 27: Carte de prédiction par KO, tranchée 2 ................................................................. 44
Figure 28: Carte de prédiction par RF, tranchée 1 .................................................................. 46
Figure 29: Carte de prédiction par RF, tranchée 2 .................................................................. 46
v
LISTE DES TABLEAUX
Tableau 1: Climat de Bibemi (A-contresens, 2021) ................................................................. 5
Tableau 2: Outils logiciels ...................................................................................................... 16
Tableau 3: Données compositées ............................................................................................ 32
Tableau 4: Statistiques descriptives tranchée 1 ....................................................................... 33
Tableau 5: Statistiques descriptives tranchée 2 ....................................................................... 33
Tableau 6: Paramètres de création de grille ............................................................................ 42
Tableau 7: Paramètres d'entrées du RF ................................................................................... 45
Tableau 8: Paramètres de validation du modèle ..................................................................... 47
vi
RESUME
Ce travail porte sur la prédiction des épaisseurs des couches lithologiques minéralisées à
partir des données géologiques obtenues à partir de la réalisation de deux tranchées sur un site
d’exploitation aurifère dans la zone de Bibemi (Nord-Cameroun). Les données géologiques des
couches de terrains ont été enregistrées sur chaque deux mètres de ces tranchées suivant la
direction NW-SE. Cette étude utilise deux méthodes à savoir le krigeage ordinaire (KO) et la
forêt aléatoire afin de déterminer celle qui fournit les meilleurs résultats concernant la
prédiction des épaisseurs dans zones enregistrées. Le but étant de cartographier les épaisseurs
des couches lithologiques minéralisées de la localité de Bibemi afin de déceler les zones
contenant des couches lithologiques à forte épaisseur minéralisée pour une exploitation future.
Etant donné que les estimations montrent des différences significatives selon la méthode
utilisée, il est intéressant d’évaluer les cartes de répartition spatiale de l’intensité obtenues en
comparant leurs qualités prédictives au moyen du calcul de la moyenne de l’erreur d’estimation
et de la variance. Cette moyenne de l’erreur d’estimation et la variance pour la méthode du
krigeage ordinaire sont de 0,033 et 2,2m2 pour la première tranchée ; 0,037 et 0,57m2 pour la
seconde. Concernant la méthode de forêt aléatoire, l’erreur et la variance sont respectivement
pour chacune des deux tranchées 0,02 et 2,12m2 puis 0,01 et 0,47m2. Ce qui montre clairement
que la méthode de la forêt aléatoire est celle qui offre la meilleure précision dans ce cas de
figure.
vii
ABSTRACT
This work focuses on the thicknesses of the mineralized lithological layers based on
geological data obtained from two trenches at a gold mining site in the Bibemi area (North
Cameroon). The geological data of the field layers were recorded on each two meters of these
trenches along the NW-SE direction. This study uses two methods, Ordinary Kriging (OK) and
Random Forest, to determine which method provides the best results in predicting the recorded
areas. The goal is to map the thickness of the mineralized rock layers in the Bibemi locality in
order to identify areas with thick mineralized rock layers for future mining.
Since the estimates show significant differences depending on the method used, it is
interesting to evaluate the spatial distribution maps of the intensity obtained by comparing their
respective qualities by means of calculating the mean of the estimation error and variance. The
mean estimation error and variance for the ordinary kriging method are 0.033 and 2.2m2 for the
first trench ; 0.037 and 0.57m2 for the second. For the random forest method, the error and
variance are respectively 0.02 and 2.12 for each of the two trenches and 0.01 and 0.47 for the
second. This clearly shows that the random forest method offers the best accuracy in this case.
Key words : lithological layers, trenches, random forest, ordinary kriging, prediction.
viii
Table des matières
DEDICACES............................................................................................................................... i
REMERCIEMENTS .................................................................................................................. ii
LISTE DES SIGLES ET ABREVIATIONS ............................................................................. iv
LISTE DES FIGURES ............................................................................................................... v
LISTE DES TABLEAUX ......................................................................................................... vi
RESUME .................................................................................................................................. vii
ABSTRACT ............................................................................................................................ viii
INTRODUCTION GENERALE ................................................................................................ 1
CHAPITRE 1 : GENERALITES ............................................................................................... 3
1.1 Cadre Géographique ................................................................................................... 3
1.1.1 Localisation .......................................................................................................... 3
1.1.2 Caractéristiques du site......................................................................................... 4
1.2 Cadre géologique........................................................................................................ 8
1.2.1 Contexte régional ................................................................................................. 9
1.2.2 Contexte local ....................................................................................................... 9
1.3 Cadre théorique ........................................................................................................ 10
1.3.1 Généralités sur les tranchées .............................................................................. 10
1.3.2 Krigeage ............................................................................................................. 11
1.3.3 Apprentissage automatique ................................................................................ 12
CHAPITRE 2 : MATERIELS ET METHODES ..................................................................... 15
2.1 Nature des données ......................................................................................................... 15
2.2 Matériels de travail ......................................................................................................... 15
2.2.1 Matériels ............................................................................................................. 15
2.2.2 Logiciels ............................................................................................................. 16
2.3 Méthodologie de travail ........................................................................................... 16
2.3.1 Compositing ........................................................................................................ 17
2.3.2 Analyse exploratoire............................................................................................ 17
2.3.3 Estimation ............................................................................................................ 21
CHAPITRE 3 : RESULTATS ET INTERPRETATIONS ....................................................... 30
3.1 Description des données ................................................................................................. 30
3.2 Prétraitement des données de base : Compositing ......................................................... 32
3.3 Analyse exploratoire....................................................................................................... 33
3.3.1 Statistiques descriptives ...................................................................................... 33
3.3.2 Histogramme ....................................................................................................... 34
3.3.3 Fonction de répartition ......................................................................................... 36
ix
3.4 Normalisation des données ............................................................................................. 37
3.5 Analyse variographique .................................................................................................. 38
3.5.1 Carte variographique ............................................................................................ 38
3.5.2 Variogramme ........................................................................................................ 40
3.6 Prédiction........................................................................................................................ 41
3.6.1 Création de la grille .............................................................................................. 41
3.6.2 Prédiction par Krigeage Ordinaire........................................................................ 43
3.6.3 Prédiction par Forêt Aléatoire .............................................................................. 45
3.6.4 Validation croisée des résultats ............................................................................ 47
3.7 Discussion ...................................................................................................................... 48
CONCLUSION GENERALE .................................................................................................. 50
Références Bibliographiques .................................................................................................... 52
Annexe : codes sur Python ....................................................................................................... 55
x
INTRODUCTION GENERALE
Contexte de l’étude
Exploité depuis le Ve siècle avant J.C, l’or est un métal précieux qui a toujours suscité
la convoitise de l’Homme. En effet, symbole de puissance, l’or fut le principal outil de mesure
de la richesse des grands empires à l’exemple de : L’empire Romains, l’empire du Mali, et
l’empire du Ghana (Olinga, 2019).
De nos jours, en plus de sa forte valeur marchande, l’or est utilisé dans plusieurs domaines
comme la médecine, la joaillerie, l’électrolyse, etc.
D’après un rapport du Ministère de l'énergie et des ressources naturelles en Côte d’ivoire,
l’exploration minière est la première étape de la vie d’une mine et un des objectifs de celle-ci
est de choisir les cibles les plus prometteuses, entre autres par la découverte d’indices
minéralisées ; ce qui nécessite un capital très important.
De par son fort potentiel minier, le Cameroun possède de nombreux indices de
minéralisations aurifères dont plusieurs sont localisés à l’Est (Investir au Cameroun N°7, 2014).
C’est fort de ce potentiel que plusieurs sociétés d’exploration minière se ruent au Cameroun.
L’attention est focalisée sur la société Oriole Cameroun qui a sollicité et obtenu du
gouvernement Camerounais un permis de recherche dans la localité de Bibemi. Le but ici est la
découverte de nouvelles minéralisations. A cet effet, plusieurs méthodes de prospection dont la
réalisation des tranchées pour bonne visualisation de couches lithologiques sont employées afin
d’atteindre cet objectif. Elle évolue par échantillonnage et analyses de la roche en contenu
métal, les échantillons étant supposés représentatifs de l’espace dont ils proviennent.
Toutefois, il arrive fréquemment de considérer des zones non minéralisées à la suite d’un
éboulement de terrain et d’une présence d’eau qui rend impossible la récupération du gravier
minéralisé (Koissi, 2010). Dans ces cas l’évaluation de l’épaisseur du gravier ou d’une
quelconque étude sur celle-ci sera biaisée.
Des méthodes d’estimation permettent cependant à partir des mesures disponibles dans
un espace donné, d’évaluer le paramètre considéré (teneur ou épaisseur) en des points de cet
espace où l’on ne dispose pas d’informations. C’est dans ce cadre que s’inscrit notre étude qui
utilisera deux de ces méthodes à savoir le krigeage ordinaire et la forêt aléatoire.
Problématique
Lors d’une prospection minière, avoir le maximum d’informations sur la zone d’étude est
primordiale. Dans le cas de l’exploitation aurifère, la connaissance de l’épaisseur exacte des
couches minéralisées est avantageuse pour décider si les investigations entreprises sont
1
prometteuses ou pas. Cependant plusieurs méthodes de prospection classiques sont utilisées
pour avoir ces informations mais ceux-ci deviennent de plus en plus onéreuses et insuffisantes.
D’où la nécessité de les associer à des méthodes plus sophistiquées.
Objectifs
L’objectif principal de ce travail est de modéliser les épaisseurs de graviers minéralisés
à partir de la méthode de la forêt aléatoire et du krigeage ordinaire. Il est détaillé en plusieurs
objectifs spécifiques à savoir :
- La régularisation des données lithologiques de la zone d’étude ;
- L’étude statistique et l’analyse spatiale des données composites ;
- La création d’une maille de points à estimer ;
- La prédiction par la méthode du krigeage ordinaire ;
- La prédiction par application des algorithmes de la forêt aléatoire ;
- La validation des différents modèles obtenus.
Plan de Travail
Dans l’optique d’atteindre les objectifs spécifiques précédemment mentionnés, les
principaux résultats de nos travaux seront présentés outre l’introduction et la conclusion
générale en trois chapitres.
Le premier chapitre vise à donner de façon générale, la localisation de la zone d’étude,
son contexte géologique et les différentes méthodes et modèles géostatistiques utilisés.
Le second chapitre comprend d’une part les matériels et logiciels ayant servi à la prise,
au traitement des données et d’autre part la méthodologie de travail effectué, suivi de la
démarche mise en œuvre pour chaque approche qui conduira à l’estimation et à la modélisation
des différentes surfaces.
Le troisième chapitre porte sur les résultats et interprétations de la prédiction des
épaisseurs minéralisées en Or réalisées avec chaque approche. L’intérêt sera aussi centré sur
une interprétation conjointe des deux approches pour pouvoir ressortir la meilleure.
2
CHAPITRE 1 : GENERALITES
Introduction
La ville de Bibemi fait l’objet de plusieurs exploitations artisanales et semi-mécanisées
d’or. D’où l’installation de grandes compagnies d’exploitation à l’instar de la société ORIOLE
dans la localité et dont les données de tranchées réalisées dans leur zone de prospection ont été
utilisées dans le cadre de ce travail. Ainsi, dans le but de localiser avec précision les zones
fortement minéralisées, il est important de maitriser la présentation géographique de la zone
d’étude, son contexte géologique ; ainsi que les différentes méthodes théoriques et approches
qui ont conduit à la réalisation des différentes estimations à partir des données issues d’une
campagne de prospection. Ceux-ci sont présenter dans ce chapitre.
1.1 Cadre Géographique
1.1.1 Localisation
La zone d’étude se trouve dans la commune de Bibemi qui est située dans le département
de le Bénoué au Nord Cameroun. Elle est située à environ 80km de la ville de Garoua, et de
l’arrondissement de Pitoa. Bibemi se localise entre le 9°19’00’’ de latitude Nord et 13°53’00’’
de longitude Est. Elle est limitée au Nord par le département du Mayo-Louti, au Sud par les
arrondissements de Lagdo et de Rey Bouba, à l’Est par Le Tchad, à l’Ouest par les
arrondissements de Pitoa et Dembo. La figure 1 situe administrativement l’arrondissement de
Bibemi, et la zone d’étude.
Elle est limitée au Nord par le département du Mayo-Louti, au Sud par les
arrondissements de Lagdo et de Rey Bouba, à l’Est par Le Tchad, à l’Ouest par les
arrondissements de Pitoa et Dembo.
3
A B C
4
par deux saisons à savoir une courte saison de pluies de quatre à cinq mois (mi-Mai à mi-
septembre), le plus souvent irrégulière et une longue saison sèche couvrant le reste de l’année
(octobre à mi-mai) et présentant une brume sèche pouvant durer deux mois (mi-décembre à mi-
février) (Douka, 2017). Sur l’année, la température moyenne est de 21,8°C et les précipitations
sont en moyenne de 951,9mm. Le tableau 1 montre plus de détails au cours de l’année.
Tableau 1: Climat de Bibemi (A-contresens, 2021)
Mois Ja Fé M Avr Mai Jui Juil Aou Sep Oc No Dé
n v ar n t t v c
Précipi Moy 1 3 26 113 135 90 151 147 138 78 18 51
tations
Nbr 0 0 1 4 6 7 9 11 9 5 1 0
e de
jour
s
Tempé Min 12 14 16 19 18 17 17 17 17 16 13 11
rature
s (°)
Moy 21 23 24 24 23 22 21 21 21 21 21 20
Max 30 31 33 31 28 27 26 26 27 28 30 30
160
30
140
25
120
20 100
Pluviométrie(°C)
Température(°C)
80
15
60
10
40
5
20
0 0
Fév Mar Avr Mai Juin Juil Aout Sep Oct Nov Déc
Pluvimétrie(mm) 3 26 113 135 90 151 147 138 78 18 51
Temerature(°C) 23 24 24 23 22 21 21 21 21 21 20
Nombre de jours de pluie 0 1 4 6 7 9 11 9 5 1 0
5
La température est variante durant l’année. Cependant en mars, la température est de
24,3°C ; température faisant de ce mois le plus chaud de l’année. Décembre est le mois le plus
froid de l’année. La température moyenne est de 20,4°C à cette période comme l’illustre la
figure 3.
b. Relief et sols
Le relief de Bibemi correspond à trois faciès géomorphologiques caractéristiques
(Barbery & Humbel, 1974):
Les plaines : L'altitude de la plaine basse est de 200 mètres. La Bénoué et le Mayo Kébi
entaillent profondément les alluvions sableuses anciennes et déposent dans la plaine basse ainsi
crée des sédiments principalement argileux.
La pénéplaine sur les roches du socle : Elle occupe la moitié Nord de la feuille ; depuis
la plaine du mayo Kébi, elle se relève lentement du Sud vers le Nord. Elle est dominée par
quelques massifs granitiques et des collines grèseuses.
Les massifs montagneux isolés : Les reliefs émergent le plus souvent brutalement de la
pénéplaine. Dans le Nord-Ouest, une zone de collines grèseuses est entaillée profondément par
une longue érosion. Les plus hauts points atteignent 418 mètres (Figure 4).
Le reste du paysage commandé par ces reliefs est faiblement dénivelé d’après Vallérie
qui a étudié les caractéristiques générales reliant les sols et les types de modèle (Vallérie, 1971).
Ils le qualifient de surface d‘aplanissement récente de la Benoué (Barbery & Humbel, 1974).
Ce paysage caractérisé par ses faibles dénivellations entre talwegs et sommets d'interfluve
6
recouvre en fait des paysages pédologiques variés : les sols sont fortement différenciés
verticalement et latéralement, sans inversion de reliefs cuirassés. Les processus pédogénétiques
sont le lessivage du fer et de l'argile en haut d'interfluve, l'hydromorphie et l'argilisation en bas
de pente. Au centre du bassin, entre les montagnes trachytiques, l'érosion est active, les sols
peu épais et peu évolués, les mayos inscrits dans la roche.
c. Hydrographie
Bibemi possède un réseau hydrographique faiblement dense (figure 5) ; il est drainé par
la Bénoué et son principal affluent est le mayo Kébi. La période des hautes eaux de la Bénoué
qui correspond à l’inondation des grandes plaines du Sud de la feuille, dure en moyenne 80
jours par an. Le maximum d’inondation de la basse plaine du mayo Kébi se situe de fin Juillet
à Septembre. Durant la saison sèche qui occupe une grande partie de l'année, la Bénoué et le
mayo Kébi ont un débit faible, mais ils ne s’assèchent pas. Les deux principaux affluents du
mayo Kébi situés sur la feuille Bébemi sont le Lebri et le Badjouma. Dans la partie Centrale et
Nord de la feuille l'érosion est très active sur les cours supérieurs du mayo Badjouma et du
mayo Lebri (Sieffermann, 1994).
7
Figure 5: Réseau hydrographique de Bibemi
La population de Bibémi est estimée à environ 236000 habitants. Elle est composée de :
Foulbé, Moundang, Mambay, Guiziga, Toupouri, Kapsiki, Arabes, Haoussa, Bornowa, Ka-
Ngou, Lamé, Fali, Gambay, Laka, Kere, Massa, Guidar, Mada, Matal, Mafa, Zoulgo. La moitié
de cette population pratique le christianisme, 40% l’islam et le reste l’animisme (Mwarf, 2021).
Ceux-ci vivent essentiellement d’agriculture et d’élevage. Mais pratiquent aussi la pèche, le
commerce et l’artisanat comme activités secondaires.
8
1.2.1 Contexte régional
Le domaine Nord-Cameroun est aussi appelé domaine Nord-Ouest Cameroun , en relation
avec sa localisation au Nord-Ouest de la faille Tcholliré-Banyo (Moussa, 2011). Au Sud et Sud-
Ouest, il est séparé du domaine Centre-Cameroun par la faille Tcholliré-Banyo, et à l’Est, il est
rattaché au domaine Mayo Kébbi. Sa limite Ouest reste encore floue. Toutefois, les études
antérieures considèrent ce domaine comme un prolongement nord-est du domaine Nord-Est
Nigeria. Les travaux menés dans ce domaine permettent de distinguer cinq unités : le groupe
de Poli, les granitoïdes pré- à syn-tectoniques, les granitoïdes syn- à tardi-tectoniques, les
granitoïdes post-tectoniques et les bassins de dépôt molassiques (Toteu S. , 1988).
Le groupe de Poli est constitué de schistes et gneiss formés à partir de protolihtes
sédimentaires et ou volcaniques, et est caractérisé par des assemblages métamorphiques de
moyen à haut grade (Toteu, 2006).
Les granitoïdes pré-tectoniques comprennent des métadiorites et des métagranodiorites
que (Penaye, Poudjoum, & Djomani, 2004) qualifient de « BIP rocks » (Basic to Intermediate
Plutonic rocks). Ils se sont mis dans les schistes et gneiss qu’ils contiennent souvent en
enclaves. Ces granitoïdes sont affectés par la déformation panafricaine D2, qui les transforme
en orthogneiss et localement en migmatites.
Les granitoïdes syn- à tardi-tectoniques (D2) constituent la plus grande majorité des
roches plutoniques panafricaines du domaine Nord-Cameroun. Ils sont composés de granites à
grain moyen à porphyroïde, et à feldspath alcalin rose.
Les granitoïdes post-tectoniques correspondent aux granites et aux syénites leucocrates à
texture variable (aplitique, porphyroïde, pegmatitique) qui affleurent sous forme de coupoles
ou d’inselbergs recoupant la structure régionale D2 et dominant le relief de plaine.
De nombreux bassins, telle que la série de Mangbai, constitués de roches sédimentaires
et volcaniques faiblement métamorphisées ont été identifiés comme des dépôts de molasse
panafricaine.
9
Figure 6: Carte géologique de Bibemi (Mey, et al., 2020)
Les tranchées peuvent être creusées au moyen d'un bulldozer, d'une excavatrice, d'une
pelle rétrocaveuse ou même à la main. Les excavatrices et les pelleteuses sont généralement
beaucoup plus rapides, moins chères et moins dommageables pour l'environnement que les
10
bulldozers, et c'est pourquoi elles sont aujourd'hui les options préférées pour le nettoyage des
coûts. Lorsque l'on creuse une tranchée, il faut utiliser une excavatrice qui peut creuser une
tranchée d'au moins 1 mètre de largeur et qui est capable de pénétrer d'au moins 1 mètre dans
le substratum rocheux reconnaissable (Dominique & Dennis, 2019). Il est très difficile
d'observer les détails de la géologie sur les parois de tranchées plus petites que cela. Les fosses
et les tranchées creusées à la main sont une option valable dans les endroits où il n'est pas
possible d'amener des équipements d'excavation motorisés sur un site éloigné, et où une main-
d'œuvre abondante et bon marché est disponible.
Dans le cadre d’exploration minière, des tranchées ont été réalisées avec succès dans
plusieurs zones. En 1995, Newcrest Mining a exploré l'or et le cuivre dans l'arc magmatique
néogène de l'île de Halmahera, en Indonésie. En raison de la couverture récente de cendres et
de colluvions, l'affleurement était limité. Le long du lit d'un petit cours d'eau et des flanks d'une
ligne de crête voisine, la prospection a permis de localiser d'abondants blocs de quartz
épithermal de type float, dont certains ont donné des teneurs élevées en or. Une série de
tranchées creusées à la main sur la pente au-dessus de ces occurrences a permis d'exposer un
affleurement de quartz épithermal faiblement sulfuré (Carlile & Davey, 1998). Une fois que
l'étendue de l'affleurement de surface a été définie par des tranchées, un vaste programme de
forage au diamant a prouvé l'existence d'une ressource exploitable à ciel ouvert de 0,99 Mt à 27
g/t d'or et 38 g/t d'Ag (Oldberg, Rayner, & Langmead, 1999).
1.3.2 Krigeage
Le krigeage est une méthode stochastique d’interpolation spatiale qui prédit la valeur d’un
phénomène naturel en des sites non échantillonnés par une combinaison linéaire de ceux
échantillonnés (Baillargon, 2005). Son intérêt réside dans le fait qu’un échantillonnage ne
fournit que des informations exactes sur le minerai qu’au point d’où proviennent ces données.
11
Il faut alors une méthode précise pour estimer la valeur aux points intermédiaires ou bien les
moyennes sur des blocs (Rivoirard, 1984). Le Krigeage donne la meilleure estimation sans
biais. Sa précision dépend de plusieurs facteurs contrôlables :
Le nombre d’échantillons et la qualité des données en chaque point.
La position des échantillons dans le champ.
La distance entre les échantillons et les points ou le bloc dont on veut estimer la valeur.
La continuité spatiale de la variable étudiée.
Il existe plusieurs types de krigeage dont le krigeage simple, le krigeage universel, le
krigeage disjonctif et le krigeage ordinaire qui est la méthode la plus utilisée.
En matière de prédiction d’épaisseur de minéralisation aurifère par utilisation des données
lithologiques, le krigeage ordinaire a été utilisée dans la Ville de Djani-Yao en côte d’ivoire.
De cette étude, il en ressort que la distribution du gravier minéralisé suit de façon continue la
direction NW-SE qui correspond à la direction générale du cours d’eau. Il en ressort également
que l’épaisseur du gravier minéralisé peut être prédite là où on ne dispose pas les données, avec
toutefois une erreur qu’il est préférable de déterminer au risque de faire une mauvaise
estimation ; ainsi une prédiction basée sur la maille rectangulaire choisie (25m×50m) conduit à
une erreur de 16% (Koissi, 2010).
La méthode d’interpolation par krigeage ordinaire, a également été utilisée dans le bassin
de junggar au Nord-Ouest de la chine. Les principales conclusions obtenues à l’issue de cette
étude font état du fait que la distribution spatiale des teneurs en Or indique que les zones de
forte anomalie sont localisées près des failles et des jonctions (Philemon, et al., 2018). L’étude
révèle également que dans la localité de Tiechanggou, les concentrations en Or sont très faibles
à cause de la présence de syenogranites qui ne favorisent par l’accumulation des minéralisations
aurifères (Philemon, et al., 2018).
12
d’algorithmes. L’analyse effectuée peut se focaliser sur des graphes, arbres, courbes de données
ou tout simplement des nombres issus du Big Data. Il repose essentiellement sur la combinaison
de deux éléments : les algorithmes et le Big Data. Tous deux, ils permettent à un robot d’adapter
ses analyses et ses comportements en se basant sur un ensemble de données provenant d’une
source (base de données ou capteurs) appartenant bien évidemment à l’ensemble du Big Data
(Scornet, 2015).
Le recours à l’apprentissage automatique repose sur une difficulté importante : une
diversité importante de comportements qui sont rapidement trop complexes à décrire. La
présence de programmes est donc requise pour ajuster un modèle qui va simplifier cette
complexité. Suivant le perfectionnement des programmes et du type d’apprentissage
automatique utilisé, ceux-ci vont intégrer (ou non) un traitement probaliste des données,
d’analyse de données, de reconnaissance ou de data-minig par exemple.
On distingue plusieurs méthodes d’apprentissage automatique chacun en fonction de sa
particularité : L’apprentissage supervisé, l’apprentissage non supervisé, l’apprentissage semi-
supervisé, l’apprentissage par renforcement (Scornet, 2015). Toutefois, dans le cadre de
l’analyse de données lithologiques à des fins d’exploration minière, plusieurs algorithmes de
certaines de ces méthodes tels que : L’analyse en composantes principales et la forêt aléatoire
ont été employés.
L’analyse en composantes principales peut être utilisée comme un outil d’analyse
exploratoire pour les données lithologiques multivariées car elle permet de réduire les
dimensions de la base de données initiale en créant des variables auxiliaires qui sont des
combinaisons linéaires des variables de départ (Ilkay, Gema, Julian, & Ortiz, 2019). Ces
différentes variables permettent généralement d’expliquer des processus géologiques sous-
jacents (Grunsky E. C., 2010). Les premiers composants révèlent généralement les structures
géologiques régionales telles que les limites de terrains ou les limites lithologiques. Les
composantes supplémentaires peuvent révéler les caractéristiques subtiles telles que l’altération
et la minéralisation (Grunsky E. C., 2014). A cet effet, l’analyse en composantes principales
des données du district de Vazante au Brésil suggère une association minéralogique des
éléments Pb et Zn avec les éléments Mo, Cu et Hg (Ilkay, Gema, Julian, & Ortiz, 2019).
La méthode de forêt aléatoire non supervisée a également été appliquée aux données du
district de Vazante au brésil. Il en ressort que les enrichissements en métal au niveau des roches
silicates sous-jacentes sont considérées comme source de métal et peuvent être considérées
comme zones de minéralisation potentielle (Ilkay, Gema, Julian, & Ortiz, 2019). D’autres
algorithmes de Machine Learning peuvent également être utilisés dans l’analyse des données
13
lithologiques à l’exemple de la classification local par grappes. Cette dernière a notamment été
employée sur des échantillons de roches sédimentaires collectés au Portugal. L’analyse de
l’ensemble des 376 échantillons collectés montre que la minéralisation aurifère est localisée le
long du fleuve Erges (Goovaerts, 2016).
Conclusion
La localité de Bibemi se trouve à environ 80 km de la ville Garoua qui est située dans le
département de le Bénoué au Nord-Cameroun. Elle possède un climat tropical de type soudano-
sahélien avec un réseau hydrographique faible. La population de Bibémi est estimée à environ
236000 habitants qui vivent essentiellement d’agriculture et d’élevage. D’un point de vue
géologique, on y rencontre plusieurs types de roches appartenant au domaine Nord Cameroun
de la chaine panafricaine. Les méthodes utilisées dans ce mémoire dans le but de découvrir plus
de couches lithologiques minéralisées dans la zone de travail ont auparavant été aussi utilisées
dans le cadre de l’exploration minière dans la ville de Djani-Yao en côte d’ivoire et au Portugal.
Présenter donc succinctement ces différentes méthodes et matériels de travail fera de ce fait
l’objet de notre prochain chapitre.
14
CHAPITRE 2 : MATERIELS ET METHODES
Introduction
Dans ce chapitre, il est question de présenter d’une part, les différents outils et logiciels
utilisés pour le traitement et l’analyse des données de tranchées et d’autre part, la démarche
mise en œuvre pour chaque approche utilisée pour l’obtention des résultats.
ArcGis Cartographie
Isatis Analyse
variographique et
l’estimation par
Krigeage Ordinaire
Strater Réalisation des logs
lithologiques
16
Ensuite, pour obtenir la prédiction des épaisseurs des couches minéralisées en or des zones non
échantillonnées, la méthode du krigeage et celle de la forêt aléatoire sont utilisées. Enfin une
validation croisée est faite afin de déterminer la méthode la plus précise dans ce cas de figure.
2.3.1 Compositing
L’analyse statistique des données de base et l’estimation de bloc exigent que chaque
échantillon ait la même pondération, ce qui signifie que tous les échantillons doivent avoir les
supports de même longueur d’échantillonnage (Huang & Xie, 2019). Ainsi, les résultats de
l’analyse sont assurés dans le processus d’estimation. Par conséquent, avant l’analyse
statistique de base et l’analyse de la fonction de variance des échantillons, il est nécessaire de
commencer à compositer les échantillons.
Il existe plusieurs méthodes de compositing, notamment la méthode de compositing le
long de la direction de forage, la méthode de compositing en banc, la méthode de compositing
par domaine géologique, la méthode de compositing interne au corps minéralisé. Pour ce
mémoire, la méthode de compositing le long de la direction de forage avec la méthode de la
région géologique sont adoptées.
Dans le processus de compositing des échantillons sur Geovia Surpac, l’influence des
longueurs moyennes des échantillons d’origine, l’espacement des lignes d’exploration, l’unité
minière minimale (UMM) et la taille du modèle de bloc sont tous pris en compte pour
déterminer les longueurs de composite finales. Le fil de fer de la minéralisation aurifère
(domaine) est utilisé pour construire la base de données afin d’identifier les principales
intersections de minéralisation. La longueur de l’échantillon dans ce cadre est de 0,1mètre,
c’est-à-dire que 0,1mètre est choisi comme longueur composite commune d’analyse statistique
pour les échantillons, et le logiciel Surpac est utilisé pour extraire les données originales de
l’échantillon et de créer les fichiers composites finaux.
2.3.2 Analyse exploratoire
Après le compositing, il est très souvent important de commencer les travaux par une
analyse exploratoire des données. Elle permet de se familiariser avec les données et d’orienter
la prise de décision dans le choix du modèle. D’après les travaux de (Isaaks, 1989), cette étape
préliminaire sera présentée ici en la divisant en deux volets : un volet univarié et un volet spatial.
a. Description univariée
Rappelons qu’en géostatistique, les données sont considérées comme une réalisation
partielle d’une fonction aléatoire (Michel & Xavier, 2000). L’analyse exploratoire vise à donner
une idée de la distribution des données. Ainsi, chaque donnée serait une observation d’une
17
variable aléatoire différente et chaque variable aléatoire aurait sa propre distribution
(Baillargeon, 2005). Dans ce cas de figure, l’échantillon de données serait donc multivarié. De
façon générale, on réalise très souvent l’analyse exploratoire en oubliant cette hypothèse de
base et en considérant les données comme plusieurs réalisations d’une même variable aléatoire.
Des statistiques descriptives univariées telles que la moyenne et la variance expérimentale ainsi
que les outils graphiques comme l’histogramme et le nuage de point sont donc utilisés afin de
mieux visualiser la distribution de la variable aléatoire.
b. Description spatiale
Les variables régionalisées peuvent être explorées spatialement. Pour la variable
aléatoire à interpoler, cette analyse descriptive est particulièrement importante. Les données
peuvent être visualisées dans un premier temps à l’aide d’un graphique 3D, ce qui permet de
juger si l’espérance de la fonction aléatoire modélisant la variable régionalisée peut être
considérée comme une fonction constante. Mais la présence des valeurs fortement différentes
les unes des autres indiqueraient que ce n’est pas le cas. Ainsi, la stationnarité du premier ordre
ou moment est étudiée. Cette stationnarité peut être examinée à l’aide d’une fenêtre mobile
(Isaaks E., 1989). Cette fenêtre mobile est tout simplement un outil qui permet de délimiter le
champ en domaine d’étude ou sous-région d’étude qui peut se croiser. Pour chacun des
domaines, des statistiques descriptives de base sont effectuées, telle la moyenne et la variance
expérimentale.
En outre, le comportement directionnel d’une variable régionalisée s’illustre par un
graphique de la variable régionalisée en fonction des données le long d’une direction (Michel
& Xavier, 2000). Le plus souvent, les deux graphiques sont faits suivant x et y. Ces nuages
directionnels permettent d’apprécier l’évolution des valeurs dans l’espace, leur tendance et leur
variabilité. Si les points d’un de ces graphiques montrent une tendance autre que linéaire de
pente nulle, l’espérance de la fonction aléatoire à interpoler n’est certainement pas stationnaire.
La structure du phénomène que présentent les données sera étudiée plus profondément
lors de l’analyse variographique. Elle peut aussi être explorée à l’aide d’un nuage de corrélation
différée (Emery, 2001), c’est-à-dire le nuage de point formé de couples (z(xi ), z(xi + h)) où h
est le vecteur de translation « donnée » et les valeurs prisent aux sites séparées de h sont
semblables. Lorsque les valeurs sont échantillonnées sur une maille régulière, on prend le
vecteur h multiple de la maille de la grille d’échantillonnage. Dans le cas contraire, on applique
une tolérance sur la longueur et l’orientation de h de manière à avoir le maximum de points
possible.
18
c. Formulation du modèle
Pour formuler un modèle conforme au phénomène matérialisé par la variable aléatoire
régionalisée, une bonne exploration des données est essentielle. En se basant sur les résultats
de cette analyse descriptive, le type de modèle et de krigeage est choisi judicieusement et
l’analyse variographique menée de façon plus éclairée. Dans le cadre de cette étude, le travail
est exécuté avec deux approches en occurrence le krigeage Ordinaire et l’apprentissage
automatique. Une validation croisée sera effectuée afin de sélectionner le meilleur modèle à la
fin.
1
γ(h) = ∗ E[Z(x) − Z(x + h)]2 (1)
2
soit 𝑁(ℎ) l’ensemble des couples (xi , xj ) de sites de mesure tels que xi − xj = h et
|N(h)| = Card(N(h)) alors,
1
γ∗ (h) = ∑ [Z(x) − Z(x + h)]2 (2)
2|N(h)|
(xi ,xj )∈N(h)
19
exemples constituent des modèles classiques de variogramme pour processus stationnaire car
ils présentent un palier, ce qui signifie que le semivariogramme est borné et la fonction aléatoire
est donc stationnaire de second ordre.
h
γ(h) = C0 + C ∗ (1 − exp (− )) (4)
a
Avec C0 = 0
2.3.3 Estimation
Cette étape est relativement rapide si l’analyse structurale a été menée correctement. Il
convient donc de définir la grille d’estimation et procéder à l’estimation.
En géostatistique et en apprentissage automatique, il existe plusieurs outils utiles à
l’estimation des valeurs d’un phénomène régionalisé de telle sorte que l’hypothèse retenue
concorde avec le modèle utilisé. Dans le cadre de ce mémoire, le krigeage ordinaire en
géostatique et de la forêt aléatoire en apprentissage automatique sont utilisés.
a. Création de la grille d’estimation
L’objectif de l’estimation est de prévoir la valeur de la variable régionalisée à interpoler
en un site. L’estimation est réalisée sur une grille régulière de points ou de blocs qui couvre le
domaine des points échantillonnés.
Dans une estimation de blocs, l’estimation est réalisée en moyenne sur chaque maille. Le
risque de commettre une erreur est moindre lorsqu’on estime une concentration moyenne sur
un support relativement large que l’on estime une épaisseur moyenne sur un support ponctuel
ou quasi-ponctuel. En contrepartie, plus la taille des blocs augmente, plus la carte présente des
discontinuités marquées, avec à l’intérieur de chaque maille, une représentation uniforme des
épaisseurs.
La réalisation de l’estimation du bloc à estimer couvre la totalité du domaine d’étude,
fournissant à l’intérieur de chaque maille une concentration moyenne et la variance
d’estimation associée.
b. Krigeage Ordinaire
L’hypothèse du krigeage simple veut que l’espérance de la fonction aléatoire Z (·) soit
connue est rarement vérifiée. Cette méthode a donc été généralisée au cas où l’espérance est
inconnue et constante localement, c’est-`a-dire sur le voisinage de krigeage : Il s’agit du
krigeage ordinaire (Matheron, 1970) qui est une technique de krigeage la plus fréquemment
utilisée selon (Chilès & Jean, 1997).
21
Dans ce type de krigeage, la moyenne du processus « m » est donc inconnue. L’estimation
prend alors la forme : Z0∗ = ∑ni=1. ∑n(i) i i
α=1 λα Zi (xα ) (5)
où :
Z0∗ : est la valeur à estimer.
Zi (xiα ): est la partie stationnaire de la variable aléatoire mesurée aux points de donnée
xα le long du profil i.
λiα : sont les poids attribués aux données issues des profils i utilisés lors de l’estimation.
Pour que l’estimateur soit sans biais, il faut imposer la contrainte habituelle :
n n(i)
∑ ∑ λiα = 1 (6)
i=1 α=1
Contrainte d’optimisation
Pour l’optimisation de ce krigeage, deux contraintes sont imposées à l’estimateur afin
d’assurer sa qualité. Celles-ci sont la contrainte de non biais et la variance minimale.
La résolution de ce dernier donne les valeurs des poids 𝜆𝑖𝛼 .
Non biais
La première condition de non biais définie à l’équation (7) correspond à la nullité de
l’espérance de l’erreur d’estimation, définie comme étant la différence entre la valeur estimée
𝑍0∗ et la vraie valeur 𝑍.
E[Z0∗ − Z0 ] = 0 (7)
Variance Minimale
22
On se trouve donc devant un problème de minimisation sous contrainte de l’équation (6).
Cette dernière équation multipliée par le coefficient de Lagrange µ, est ajouté à l’équation (9).
Il en résulte une nouvelle fonction Ɵ à minimiser (équation (10)).
n n(i)
n n(i)
Il est souvent très important de visualiser ces équations de krigeage ordinaire sous forme
matricielle :
K o λo = k o
σ2ko = Var[Z0 ] − λ′0 k 0
𝑖
𝑐𝑜𝑣(𝑍𝑖 (𝑥𝛼𝑖 ), 𝑍𝑖 (𝑥𝛽𝑖 ))
𝑗
𝑐𝑜𝑣(𝑍𝑖 (𝑥𝛼𝑖 ), 𝑍𝑗 (𝑥𝑙 )) 1 𝜆𝛽 𝑐𝑜𝑣(𝑍𝑖 (𝑥𝛼𝑖 ), 𝑍0 ))
.
[ . . . ] [ 𝜆𝑙𝑗 ] = [ ]
.
1 1 0 𝜇 1
𝐊𝟎 𝛌𝟎 𝐤𝟎
En définitif, la mise en œuvre de manière simpliste du krigeage ordinaire est présentée par
l’organigramme de la (Figure 11).
23
Figure 11: Mise en œuvre du krigeage ordinaire (Matheron, 1970)
c. Forêt aléatoire
Cette partie est effective grâce au logiciel Python. Il existe un grand nombre de modules
préprogrammés qui sont fournis d’office avec python. La distribution Anaconda
(environnement du langage python) est livrée avec plus de 250 modules automatiquement
installés, et plus de 7500 modules de sources ouvertes supplémentaires peuvent être installés à
partir du référentiel standard de packages python PyPI (gestionnaire de package pip) ainsi que
24
le gestionnaire de package conda (Sébastien, 2019). Dans le cadre de ce mémoire plusieurs
modules ont été utilisés, entre autre :
25
b. Apprentissage
Après l’importation de l’algorithme à partir du module Sklearn, on crée la forêt aléatoire
à x arbres.
Ici l’algorithme de la forêt aléatoire génère un jeu d'arbres doublement perturbés au
moyen d'une randomisation opérée à la fois au niveau de l'échantillon d'apprentissage et des
partitions internes. Chaque arbre du jeu est ainsi généré au départ d'un sous-échantillon
bootstrap du jeu d'apprentissage complet, de manière similaire aux techniques de bagging.
Ensuite, l'arbre est construit et à chaque nœud la sélection de la meilleure partition basée
sur l'indice de Gini, ne s'effectue pas sur le set complet de M attributs, mais sur un sous-
ensemble sélectionné aléatoirement au sein de celui-ci. La taille F de cette sélection est fixée
préalablement à l'exécution de la procédure (1 ≤ F ≤ M). L'arbre est ainsi développé jusqu'à sa
taille maximale, sans élagage. Lors de la phase de prédiction, l'individu à classer est propagé
dans chaque arbre de la forêt et étiqueté. La prédiction globale de la forêt est fournie par un
vote à la majorité simple des attributions de classe des arbres individuels. Concrètement de
manière pratique, le module scikit_learn du langage python utilise les attributs suivants :
« Bootstrap » : Est contrôlé par les valeurs « True (valeur par défaut) » et
« False ». S’il prend « True » en entrée, plutôt qu’utiliser toutes les données pour
construire les arbres, on choisit pour chaque arbre aléatoirement un sous-ensemble
(avec répétition possible) des données ;
« criterion » : Ayant comme valeur par défaut « gini », elle est une fonction
permettant de mesurer la qualité d’un fractionnement. Les valeurs pris en charge
sont « gini » pour l’impureté de Gini et « entropie » pour le gain d’information.
Ce paramètre est spécifique à l’arbre ;
« max_depth »: Est la profondeur maximale de l’arbre. Avec « None » comme
valeur par défaut, les nœuds sont développés jusqu’à ce que toutes les feuilles
soient pures ou que toutes les feuilles contiennent moins de « min_samples_split »
(un attribut) échantillons ;
« max_features »: Est le maximum de caractéristiques et prend en entrée les
valeurs « auto (valeur par défaut) », « sqrt », « log2 » il peut être entier (int) ou
chaine de caractères (float) . Le nombre de caractéristiques à prendre en compte
lors de la recherche de la meilleure répartition :
- S’il est entier, alors les caractéristiques « max_features » sont prises en compte à chaque
fractionnement ;
26
- S’il est flottant alors « max_features » est une fraction et les caractéristiques round
(max_features* n_features) sont considérées à chaque fractionnement ;
- Si « auto », alors « max_features » =sqrt(n_features) ;
- Si « sqrt », alors « max_features » = sqrt(n_features) ;
- Si « log2 », alors « max_features » =log(n_features) ;
- Si aucun alors « max_features » =n_features ;
Remarque : la recherche d’un fractionnement ne s’arrête pas tant qu’au moins une
partition valide des échantillons de nœuds n’est pas trouvée, même si cela nécessite
d’inspecter effectivement plus de caractéristiques que « max_features ».
« max_leaf_nodes » : Prend en entrées des entiers (int) et a « None » comme
valeur par défaut. Il fait croitre les arbres avec max_leaf_nodes de la manière la
plus efficace possible. Les meilleurs nœuds sont définis comme une réduction
relative de l’impureté. Si None, le nombre de nœuds de feuilles est illimité ;
« min_impurity_decrease »: Prend les chaines de caractères (float) en entrées. Ici,
un nœud sera divisé si cette division induit une diminution de l’impureté
supérieure ou égale à cette valeur ;
« max_samples » : Peut être entier ou flottant. Toutefois si l’attribut « bootstrap »
est « True », il est le nombre d’échantillons à tirer de X pour entrainer chaque
estimateur de base.
- Si « None (valeur par défaut) », alors on tire des échantillons de X.
- S’il est un entier, on tire des échantillons max_samples
- S’il s’agit d’un flottant, on tire des échantillons max_samples*X.
« min_samples_leaf » : Est le nombre minimum d’échantillons requis pour être à
un nœud feuille. Un point de scission à n’importe quelle profondeur ne sera
considéré que s’il laisse au moins « min_sample_leaf » échantillons de formation
dans chacune des branches gauche et droite. Cela peut avoir pour effet de lisser le
modèle, en particulier dans la régression. Sa valeur par défaut est 1 ;
« min_samples_split » : Représente le nombre minimum d’échantillons requis
pour diviser un nœud interne et prend 2 comme valeur par défaut en entrée ;
« ccp_alpha » : Type chaines de caractères, il est le paramètre de complexité
utilisé pour le Minimal Cost-Complexity Pruning. Le sous arbre avec la plus
grande complexité de coût qui est plus petite que ccp-alpha sera choisi. Par défaut,
aucun élagage n’est effectué ;
27
« min_weight_fraction_leaf » : Est la fraction pondérée minimale de la somme
totale des poids(de tous les échantillons d’entrée) requise pour être à un nœud
feuille. Les échantillons ont un poids égal lorsque « sample_weight » n’est pas
fourni ;
« n_estimators » : Représente le nombre d’arbres dans la forêt avec 100 comme
valeur par défaut ;
« n_jobs » : De type entier, est le nombre de tâches à exécuter en parallèle. « Fit »,
« predict », « decision_path » et « apply » sont tous parallélisés sur les arbres.
« None » signifie 1, -1 signifie utiliser tous les processeurs ;
« oob_score » : Permet de calculer le score de prédiction et prend « False », s’il
faut utiliser les échantillons hors-sac pour estimer le score de généralisation si
« bootsrap » = « True » ;
« random_state » : Contrôle à la fois le caractère aléatoire du tirage aléatoire des
échantillons utilisés lors de la construction des arbres (si « bootsrap »= « True »)
et l’échantillonnage des caractéristiques à prendre en compte lors de la recherche
de la meilleure division à chaque nœud (si max_features<n_features). Il prend des
entiers en entrée et sa valeur par défaut est « None » ;
« verbose » : Contrôle la verbosité lors de l’ajustement et de la prédiction. Sa
valeur par défaut est 1 et peux juste admettre des entiers ;
« warm_start » : Considère juste les booléens. Sa valeur par défaut est « False » ;
lorsqu’il a pour valeur « True », il réutilise la solution de l’appel précédent à
l’ajustement et ajoute plus d’estimateurs à l’ensemble, sinon, ajuste simplement
une toute nouvelle forêt ;
c. Entrainement
Le modèle crée à partir des attributs de forêt aléatoire est entrainé sur les données
d’entrainement sectionnées des données de base plus haut ;
d. Test
Le test se fait aussitôt sur les données de test sectionnées des données de base plus haut à
l’aide du modèle crée.
e. Calcul de l’erreur
L'utilisation d'échantillons « bootstrap » autorise notamment le calcul du taux d'erreur
OOB, qui fournit une estimation non biaisée du taux d'erreur en généralisation sans avoir
recours à un échantillon test supplémentaire. Deux autres informations sont également
28
calculées, une mesure de l'importance des différents attributs dans le prédicteur final, et une
mesure de proximité des individus classés ; c’est-à-dire la moyenne des erreurs et la variance.
Ceux-ci étant minimes, la prédiction peut être effectuée.
f. Prédiction
Après avoir importé dans l’espace de travail la base de données à prédire, elle est
convertie en tableaux pour faciliter la manipulation. Ensuite l’algorithme de prédiction est
appliqué et les résultats obtenus.
g. Répartition spatiale
Les valeurs prédites sont représentées selon leurs positions géographiques sur une carte
par l’application des contours.
Conclusion
Dans le cadre de ce mémoire, le matériel utilisé a été : Un ordinateur portable, une clé
internet pour garantir l’accès à internet. En ce qui concerne les outils logiciels, l’attention est
centré sur Gemcom Surpac pour compositer les données, Strater pour la réalisation des logs
lithologiques, Isatis pour l’analyse variographique, l’estimation par KO et enfin Python pour
l’analyse statistique et la prédiction par forêt aléatoire qui a été méthodologiquement décrit
ainsi que le Krigeage Ordinaire. Dans la suite du travail, une présentation différents résultats
obtenus sera faite.
29
CHAPITRE 3 : RESULTATS ET INTERPRETATIONS
Introduction
Le but de ce chapitre est de présenter de manière succincte les différents résultats issus
de la prédiction des épaisseurs minéralisées de la zone d’étude par la méthode de forêt aléatoire
et du krigeage ordinaire à partir des épaisseurs des couches lithologiques observées des
tranchées.
3.1 Description des données
La base de données obtenue après observations des deux tranchées réalisées entre les
latitudes 392845N, 393387N et les longitudes 1041491E, 1041698E contient 1597 données
lithologiques. Soit 1053 données pour la première et 544 pour la seconde tranchée
respectivement. Cependant le travail a principalement été centré sur les épaisseurs des couches
lithologiques minéralisées en Or. Celles-ci sont donc représentées pour les deux différentes
tranchées dans les logs lithologiques suivants (Figure 12 et Figure 13).
30
Figure 13: Log lithologique tranchée 2
La première tranchée (Figure 12) mesure 572 mètres. Cinq couches lithologiques que sont
les roches felsiques (F), les roches felsiques porphiriques (FP), les schistes mafiques (Msc), les
granodiorites (Fgd) et la diorite (Id) y sont identifiées. Toutefois, des éléments en traces sont
observés sur 12m (331m-343m) de la tranchée. Ceci signifiant que cette partie ne suscite aucun
intérêt. Aussi, il est à noter que cette tranchée présente majoritairement les couches de schistes
mafiques reparties sur huit intervalles (0-251m, 255-256m, 257,7-292.5m, 293,2-317m, 318,5-
331m, 343-490m, 507-508m, 512-572m) ; soit 531,1 mètres.
La seconde tranchée (Figure 13) quant à elle mesure 577 mètres et contient quatre couches
que sont les roches felsiques (F), les roches felsiques porphiriques (FP), les schistes mafiques
(Msc) et les amphibolites (Mam). Néanmoins, il est aussi noté des éléments en trace sur 7
31
mètres (342m-349m) de la tranchée. Des couches à intérêt majeur, l’attention est également
portée sur les schistes mafiques de par leur présence prépondérante de part et d’autre de la
tranchée. Cette couche s’étend donc sur 17 intervalles (41-48,5m, 62-84m, 86-104m, 113-
118m, 120-124m, 126-129m, 132-136m, 137-148m, 150-165m, 167-172m, 173-174m, 177-
178m, 179-224m, 229-273m, 286-332m, 349-390m et 395-577m) ; soit 409,5m.
Ce qui soulève le fait que les roches de ces tranchées ont un aspect feuilleté dû à la
schistosité et possèdent en grande quantité des minéraux ferromagnésiens.
32
3.3 Analyse exploratoire
Les études statistiques sont indispensables avant toute étude géostatistique (Huang &
Xie, 2019). En effet, ces études permettent d’obtenir les caractéristiques des données étudiées
ainsi que leur distribution afin de supprimer les valeurs aberrantes. Ainsi les principaux outils
permettant de caractériser une série statistique ont été ressortis : histogramme, moyenne,
variance, coefficient d’asymétrie, fonction de répartition.
3.3.1 Statistiques descriptives
Les différents résultats des travaux sur l’analyse descriptive sont enregistrés dans les
tableaux 4 et 5.
Tableau 4: Statistiques descriptives tranchée 1
Effectifs Epaisseur Epaisseur Moyenne Variance Ecart- Coefficient
minimale maximale type d’asymétrie
Les tableaux 4 et 5 indiquent que la valeur minimale des épaisseurs des couches
minéralisées est de 0,01 mètre pour la tranchée 1 et 2. La valeur maximale quant à elle est de
10 mètres pour la tranchée 1 et 3 mètres pour la seconde.
La moyenne des épaisseurs des couches minéralisées est de 4,212 mètres pour la tranchée
1 et 2,011 mètres pour la tranchée 2. La variance quant à elle est de 4,122 m2 pour la première
tranchée et 0,4814 m2 pour la seconde. La variance est une caractéristique de dispersion
mesurant l’écart des teneurs par rapport à la moyenne. Dans la pratique, l’écart type est plus
utilisé car il s’exprime selon les mêmes unités que les données de travail. Dans le cas des
données de Bibemi, la tranchée 1 a un écart-type de 1,537 et la tranchée 2, 0,6932. Ces deux
valeurs d’écart-type montrent que les valeurs observées sont très éloignées de la valeur
33
moyenne, et particulièrement pour la tranchée 1. Ceci dit, ces valeurs traduisent le fait que dans
l’ensemble, les données ont une grande dispersion.
Le coefficient d’asymétrie comme son nom l’indique évalue l’asymétrie de la distribution
de la variable aléatoire étudiée. Il est de -0,663 pour la tranchée 1 et -1,0584 pour la 2. Ces
derniers étant négatifs, les données présentent donc une asymétrie négative. C’est-à-dire
qu’elles ont une distribution étalée à gauche de la moyenne. Ce qui signifie que les données ne
sont pas gaussiennes (normales) ; elles nécessitent donc une transformation gaussienne par
anamorphose.
3.3.2 Histogramme
L’histogramme de fréquence des épaisseurs est une représentation graphique permettant
de ressortir la répartition d’une variable continue afin de détecter certains indicateurs de
données aberrantes (Michel & Xavier, 2000). Les figures 14 et 15 ci-après illustrent
l’histogramme de fréquences des épaisseurs minéralisées en Or des couches lithologiques des
deux tranchées.
34
Figure 15: Histogramme tranchée 2
L’histogramme (Figure 14) divise la série statistique en différentes classes. Ainsi,
concernant les données étudiées, 5 classes sont observées : [0,1], [2, 3], [3,4], [5, 6], [9,10]. Le
mode de cette série statistique est la classe [5, 6], ceci veut dire que la majorité des épaisseurs(E)
ont des variations comprises dans cet intervalle. Par ailleurs, la dernière classe a une faible
fréquence, d’où un nombre limité de couches présentant des épaisseurs minéralisées en Or dans
cet intervalle.
L’histogramme (Figure 15) divise cette série statistique en plusieurs classes. 4
classes sont à noter : [0,1], [1,2], [2,3], [3,4]. Le mode de la série statistique est la classe [2, 3],
ceci veut dire que la majorité des épaisseurs(E) ont des variations comprises dans cet intervalle.
Toutefois, les deux histogrammes viennent confirmer les observations faites au niveau
de la statistique descriptive détaillée. Observations qui montrent que :
Les valeurs s’éloignent beaucoup des deux valeurs moyennes ;
Des asymétries négatives ;
La présence de plusieurs valeurs aberrantes de par l’absence d’observations au
niveau des intervalles [1,2], [4,5], [6,9] dans l’histogramme de la tranchée 1.
35
3.3.3 Fonction de répartition
Les figures 16 et 17 ci-dessous illustrent la fonction de répartition des épaisseurs
minéralisées en or dans la zone d’étude.
36
observations de l’histogramme de fréquences. Dans ces deux figures 16 et 17, les variations
sont nombreuses mais aussi sont plus constantes au niveau des épaisseurs 5 mètres pour la
tranchée 1 et 2 mètres pour la seconde.
37
Il est clairement observé sur ces figures que les deux histogrammes des données
normalisées suivent désormais une loi normale. Ceci dit l’analyse variographique et autres
traitements peuvent alors se faire aisément.
38
Figure 21: Carte variographique tranchée 2
La carte variographique de la tranchée 1 (Figure 20) montre différentes couleurs qui
s’étendent continuellement dans toutes directions. Toutefois le trait en noir sur la figure suit la
direction de plus grande continuité et sa perpendiculaire, celle de faible continuité. Ce qui
traduit respectivement une anisotropie :
Une anisotropie dans la direction N160 qui est de ce fait la direction majeure des
épaisseurs minéralisées ;
Une autre anisotropie dans la direction N70, direction mineure d’épaisseurs
minéralisées.
Ceci dit, les différents variogrammes des composites seront effectués dans les directions
d’anisotropie.
La carte variographique de la tranchée 2 (Figure 21) quant à elle montre aussi des couleurs
majeures et mineures mais ceux-ci ne s’étendent pas continuellement suivant toutes les
directions. Ce qui traduit dans ce cas une isotropie. De ce fait, le variogramme sera réalisé dans
toutes les directions.
39
3.5.2 Variogramme
L’idée fondamentale à la base de la notion de variogramme est que la nature n’est pas
totalement imprévisible. Deux observations situées l’une près de l’autre devraient en moyenne,
se ressembler davantage que deux observations éloignées.
Les différents variogrammes expérimentaux des épaisseurs minéralisées en or réalisés
suivant un de pas 5 mètres après ajustement de ce dernier ont pu être calculés par un modèle
sphérique. Le résultat s’illustre sur les figures 22 et 23.
40
Concernant la tranchée 1, les caractéristiques des modèles d’ajustement dans les
directions d’anisotropie mineure et majeure indiquent :
Une portée de 8.59368 m suivant la direction majeure et 1.66618 m suivant la direction
mineure qui montre la distance à partir de laquelle deux observations ne sont plus
linéairement liées dans ces différentes directions. Ainsi, au-delà de cela, la covariance
entre deux observations est nulle et donc ne peuvent pas former de paires pour le calcul
du variogramme. A cette distance, la valeur du variogramme correspond à la variance
de la variable aléatoire.
Un palier de 1,8m2 suivant la direction majeure et 2.36 m2 suivant la direction mineure
qui correspond à la variance de la variable aléatoire.
L’effet de pépite indiquant les erreurs de mesure ou les erreurs d’échantillonnage. Sa
valeur étant de nulle exprime également des variations à très courte échelle des
différentes épaisseurs.
Plus la portée d’un variogramme est grand, plus il donne des informations sur la
continuité d’un phénomène. Dans ce cas, il serait idéal de considérer le variogramme dans la
direction majeure car elle est celle qui a la plus grande portée.
Toujours dans le but d’avoir une idée générale sur la variation des épaisseurs minéralisées
sur la seconde tranchée, le variogramme de la figure 23 a été effectué. Ce variogramme a été
ajusté par un modèle sphérique de paramètres suivants :
Un palier de 0,48m2 ;
Un effet pépite de 0,2 dû aux erreurs de localisation, d’échantillonnage ou encore à
une variation minime non perceptible à cause du pas ;
Une portée (distance à partir de laquelle tous les variogrammes ont la même valeur) de
47 mètres.
3.6 Prédiction
3.6.1 Création de la grille
Afin de faire une prédiction des épaisseurs des couches minéralisées en or dans la zone
d’étude au niveau des endroits non échantillonnés, un maillage suivant une grille régulière de
points couvrant les deux différentes tranchées a été effectué. Il est noté respectivement les
caractéristiques de maillage dans le tableau 6.
41
Tableau 6: Paramètres de création de grille
43
Figure 27: Carte de prédiction par KO, tranchée 2
La prédiction par krigeage ordinaire sur la grille de la première tranchée (Figure 26)
montre que les épaisseurs des couches minéralisées en Or varient entre 1,06m et 5m.
Majoritairement, les couches minéralisées sur celle-ci ont une grande épaisseur (4,67- 5m) et y
sont regroupées dans toute la partie Sud ainsi que la partie Est de la grille d’estimation.
Les couches à faibles épaisseurs (1,06-1,99m) y sont aussi regroupées dans la partie NNW
mais pas en nombre assez considérable. Quelques-uns dans la partie NE sont aussi à noter
accompagnées des couches minéralisées avec des épaisseurs assez variantes (2,46-2,83m, 2,83-
3,16m, 3,16-3,77m, 3,77- 4,37m).
La prédiction par Krigeage Ordinaire sur la grille de la seconde tranchée (Figure 27)
montre que les couches minéralisées dans cette grille ont des épaisseurs qui varient beaucoup
dans l’espace. Elles vont de 0,20m à 3m.
Toutefois, les couches minéralisées majoritaires sur celle-ci ont une épaisseur moyenne
comprise entre 1,88m et 2,16m dans la partie Nord-Est de la grille d’estimation. On constate
aussi que les couches à fortes épaisseurs (2,44-3m) sont faiblement représentées dans l’espace
du coté Est de la carte.
Ceci dit, de par les résultats obtenus à l’aide de cette méthode de prédiction, les
investigations futures doivent au préalable être centrées au niveau des couches ayant de grandes
épaisseurs minéralisées en Or. C’est-à-dire au niveau la partie Sud ainsi que la partie Est de la
grille d’estimation tranchée 1 ; La partie Est de la tranchée 2.
44
3.6.3 Prédiction par Forêt Aléatoire
L’apprentissage d’ensemble est un type d’apprentissage dans lequel on associe différents
types d’algorithmes ou le même algorithme plusieurs fois pour former un modèle de prédiction
plus puissant. L’algorithme de la forêt aléatoire combine donc plusieurs algorithmes du même
type, c’est-à-dire plusieurs arbres de décision, ce qui donne une forêt d’arbres.
Ayant ainsi dans ce mémoire une tâche de régression à résoudre, on fera la moyenne des
résultats obtenus au niveau des arbres de la forêt afin d’obtenir notre modèle de prédiction.
Les attributs de « Random Forest » pour perfectionnement du modèle sont donc les
suivants :
Tableau 7: Paramètres d'entrées du RF
Ce qui permet donc de générer les résultats sur les cartes suivantes :
45
Figure 28: Carte de prédiction par RF, tranchée 1
46
La figure 29 précédente représente la prédiction des épaisseurs des couches minéralisées
sur la grille de prédiction tranchée 2. Ceux-ci varient entre 0,01 mètre et 3 mètres.
En effet, les couches minéralisées à forte épaisseur (2,1-3m) sur la grille d’estimation sont
peu représentées dans l’espace.
Toutefois, en fonction du regroupement des autres couches minéralisées dans l’espace ils
peuvent être diviser en trois parties, les couches minéralisées avec les épaisseurs comprises
entre :
1,8 et 2,1 mètres qui représentent les épaisseurs moyennes et le plus grand
regroupement dans l’espace ;
0,91 et 1,21 mètres : faibles épaisseurs ;
0,01 et 0,31 mètres : épaisseurs très faibles.
Des résultats de cette prédiction, la conclusion est que les futures investigations se
concentreront tout d’abord sur les zones à fortes épaisseurs, ensuite sur les moyennes et enfin
sur les faibles et très faibles.
47
Les résultats du tableau 8 montrent que la prédiction par forêt aléatoire sur les figures 28
et 29 sont plus précises et sans biais car la moyenne des erreurs dans le cas de chaque tranchée
est meilleure avec une variance d’estimation minimale.
Mis à part les résultats de validation croisée présentés dans le tableau 8, dans l’optique
d’apporter d’amples éclaircis par rapport à la comparaison entre les cartes obtenues par
krigeage ordinaire et celles obtenues par forêt aléatoire, une comparaison visuelle est aussi faite.
De celle-ci, on observe clairement que les cartes obtenues par la méthode de forêt aléatoire
présente des délimitations bien précises par rapport à celle faite par krigeage ordinaire.
3.7 Discussion
La particularité des méthodes d’estimation pour la cartographie réside dans le fait qu’elle
ne nécessite pas une connaissance exhaustive du phénomène étudié ou de ses réalisations. Autre
chose qui vient s’ajouter à cela est que ces méthodes ont la capacité, du fait de la prise en
compte de la structure spatiale du phénomène étudié, de pouvoir relativement se rapprocher
d’une représentation plus réaliste.
Dans ce mémoire, avant d’effectuer toutes estimations, il a fallu au préalable normaliser
le peu d’informations recueillies sur le terrain en enlevant les informations aberrantes et par la
suite créer des grilles d’estimations au tour de chacune des tranchées (respectivement 13×9 et
21×11) afin d’y faire des prédictions.
Deux méthodes d’estimation ont été utilisées : Le krigeage Ordinaire en géostatistique et
la forêt aléatoire en apprentissage automatique. Ensuite, faire une comparaison et en ressortir
la meilleure. Les paramètres de validation croisée de la forêt aléatoire ayant donc été favorables
par rapport à ceux du krigeage ordinaire ont fait de lui la meilleure méthode.
Dans leurs travaux, (Laurent Heutte , 2008) notent que dans la méthode de forêts
aléatoires (RF pour Random Forest), un nombre préalablement fixé d’arbres de décision est
généré, à l’aide notamment de principes d’apprentissage partiellement aléatoires. Ceci pour dire
que ce type de processus présente deux principaux inconvénients :
Le nombre d’arbres doit être fixé a priori ;
L’interprétabilité et les capacités d’analyse offertes par les classifieurs de type
arbres de décisions sont perdues, du fait de l’utilisation des principes
"randomisation" au cours de leur induction.
Ces constats soulèvent alors deux questions : Ce type de forêts aléatoires contient-elle des
arbres de décision qui détériorent les performances de l’ensemble ? Si oui, ces arbres
48
présentent-ils des propriétés particulières qui pourraient expliquer cette perte de performances
?
Conclusion
La prédiction des couches lithologiques minéralisées dans les endroits non échantillonnés
de la zone de travail s’est effectuée selon une approche comparative : Prédiction par Krigeage
ordinaire et prédiction par forêt aléatoire. A cet effet, la prédiction par forêt aléatoire est
meilleure que celle par Krigeage ordinaire car son erreur d’estimation est plus petite. Par
ailleurs, la prédiction par forêt aléatoire effectuée sur la tranchée 1 a permis de déduire que les
zones situées au centre et au sud des zones à prédire présentent des couches lithologiques en
minéralisation aurifère très épaisses.
49
CONCLUSION GENERALE
Les résultats présentés dans ce document montrent l’apport de la géostatistique et du
machine learning dans l’exploration minière. Ces études ont principalement été réalisées dans
le but de cartographier les épaisseurs estimées des couches minéralisées en or aux alentours des
différentes tranchées. Pour atteindre ce but, plusieurs objectifs spécifiques ont été également
atteints au préalable :
- La régularisation des données ;
- Une étude statistique et analyse spatiale des données composites ;
- La création d’une maille de points à estimer ;
- La prédiction par Krigeage Ordinaire ;
- La prédiction par les algorithmes de RF ;
- Une validation croisée entre les deux modèles obtenus.
Pour ce faire, au chapitre 1 les généralités sur la zone d’étude ainsi que sur les méthodes
utilisées ont été présentées au préalable. D’un point de vue géologique, plusieurs types de
roches appartenant au domaine Nord-Cameroun de la chaine panafricaine ont été identifiés.
Par la suite, le matériel et la méthodologie de travail utilisée a été détaillés au chapitre 2. Les
logiciels tels que Strater et Isatis ont été utilisés pour la réalisation des logs lithologiques et
l’analyse variographique. Ensuite, une estimation par KO avec le logiciel Isatis, Python pour
l’analyse statistique et la prédiction par forêt aléatoire ont suivis. Enfin au chapitre 3, les
analyses et interprétations des différents résultats obtenus ont été présentés.
En effet l’estimation par krigeage ordinaire a présenté pour chacune des deux tranchées
des erreurs et des variances plus grandes par rapport à la forêt aléatoire. Soit respectivement
0,41 et 2,2m2 contre 0,02 et 2,12m2 pour la première tranchée ; 0,037 et 0,57m2 contre 0,01 et
0,47m2 pour la seconde tranchée. Ainsi, de cette étude il en ressort que la forêt aléatoire offre
une meilleure estimation de la variabilité spatiale des épaisseurs lithologiques minéralisées en
Or comparativement au Krigeage Ordinaire.
Par ailleurs, il en ressort également qu’au niveau de la grille d’estimation de la
première tranchée, les couches minéralisées ayant des épaisseurs comprises entre 3,96 et 5,35m
sont nombreuses et occupent une grande partie de la zone estimée. Ainsi, cette partie constitue
une zone de grand intérêt et peut être l’objet d’investigations futures de la part de la compagnie
Oriole.
En perspective de ce travail, il serait intéressant d’utiliser cette méthode de forêt aléatoire
sur plusieurs autres données observées sur un nombre considérable de tranchées. Ceci afin de
50
ressortir non seulement des cartes de prédiction encore plus précise que celles présentées dans
ce mémoire mais aussi une prédiction sur une plus grande surface, car ces prédictions pourront
être réalisées sur une plus grande carte appartenant à un permis précis.
51
Références Bibliographiques
Barbery, & Humbel. (1974). Notice explicative n°53 carte pedologique de reconnaissance
feuille Garoua à 1 / 200.000. Yaounde: Centre O.R.S.T.O.M. de Yaounde.
Carlile, & Davey. (1998). Discovery and exploration of the Gosowong epithermal gold
deposit. 207-227. Halmahera Island, Indonesia.
Chilès, & Jean, P. (1997). Géostatistique des phénomènes non stationnaire, Thèse de Docteur
de l’Université de Nancy-I. 25-27. Nancy.
Douka, A. (2017). Etude sur les Métiers Rentables dans les Communes Partenaires du PARSE
Région du Nord. 20-25. Garoua: Deutsche Gesellschaft für Internationale
Zusammenarbeit (GIZ) GmbH.
Grunsky, E. C. (2014). A study of the lake sediment geochemistry of the Melville Peninsula
using multivariate methods: applications for predictive geological mapping. Journal of
Geochemical Exploration, 141.
Huang, S., & Xie, Y. L. (2019). Geostatistical estimation analysis of typical Carlin gold deposit
in Hunan province. IOP Publishing, 7.
Ilkay, C., Gema, O., Julian, M., & Ortiz. (2019). Knowledge discovery from geochemical
data with supervised and unsupervised methods. 321-329.
Isaaks E., S. R. (1989). Applied Geostatistics. Oxford University Press, New York, 46.
Isaaks, E. (1989). Applied Geostatistics. page 46. New York: Oxford University Press.
52
Koissi, R. (2010). application desméthodes de krigeage à la prospection minéralogique : Cas
du permis d'exploitation artisanale de Djani-Yao. 50-58. Yamoussoukro: Institut
National Polytechnique Houphouet Boigny.
Laurent Heutte . (2008). De la sélection d’arbres de décision dans les forêts aléatoires. 10ème
Colloque International Francophone sur l’Ecrit et le Document (CIFED), 163-168.
Matheron, G. (1970). La théorie des variables régionalisées, et ses applications. 50-52. Ecole
de Mines de Paris: Les cahiers du Centre de morphologie mathématique de
Fontainbleau, Fascicule 5.
Mey, A. M., Bardintzeff, J. M., Fagny, M. A., Nkouandou, O. F., Tchameni, R., &
Dianamou, A. (2020). Petrology and geochemical framework of dolerites dykes of
Temté. Acta Geochimica, 24-27.
Michel, A., & Xavier, E. (2000). Estimation et interpolation de données spatiales. Hermes
Science Publications, Paris, 46-50.
Mitchell, A., Ausa, C., Deiparine, L., Hlaing, T., Htay, N., & Khine, A. (2004). The Modi
TaungNankwe gold district, slate belt, central Myanmar: Mesothermal veins in a
Mesozoic orogen. 321-341.
Oldberg, D., Rayner, J., & Langmead, R. (1999). Geology of the Gosowong epithermal gold
deposit,. 179-185. Halmahera, Indonesia.
53
Penaye, J., Poudjoum, & Djomani, Y. (2004). Geodynamic evolution of the panAfrican belt
of Central Africa with special reference to Cameroon. Journal of African Earth
Sciences, 73-85.
Philemon, L., Yongjoun, L., Gaoxue, Y., Fenghao, D., Zuopeng, & Wang. (2018).
Application of geostatistical analyst methods in discovering concealed gold and
pahtfinder elements as geochemical anomalies related to ore mineralisation. 178-192.
R.Marjoribanks. (2010). Geological Methods in Mineral Exploration and Mining 2nd ed. 63-
65. Berlin.
Rivoirard, J. (1984). Le comportement des poids de Krigeage. 75-83. Ecole Nationale des
Mines de Paris.
Shi, & Tao. (2005). Unsupervised Learning with Random Forest Predictors. 235-270. Los
Angeles.
Toteu. (2006). Diachronous evolution of the Congo craton, insights from U-Pb ion microprobe
dating of zircons from Poli, Lom and Yaoundé groups (Cameroon). 32. Journal of
African Earth Sciences 44.
Toteu, S. (1988). Géochronologie des grands ensembles structuraux de la région de Poli. 14.
Cameroun: Thèse, Doc. Etat, Univ. de Nancy 1, 197.
Vallérie, M. (1971). Carte pédologique du Cameroun occidental avec notice explicative. 45-
48.
Vicat, J. (1998). Esquisse géologique du Cameroun. 87-95. Yaoundé: Collect. Géocam. Press.
Univ. de Yaoundé I.
54
Annexe : codes sur Python
Annexe 1 : analyse descriptive
import pandas as pd
dataset = pd.read_csv("BT_013.csv",sep=";",decimal=",")
#analyse exploratoire
ana_exp = stat.describe(dataset['E'])
print(ana_exp)
ag= stat.normaltest(dataset['E'])
print(ag)
#histogramme
import numpy as np
plt.figure(figsize=(10,5))
plt.xlabel('E')
plt.ylabel('Fréquence')
plt.style.use('seaborn-ticks')
plt.show()
55
from sklearn.ensemble import RandomForestRegressor
import pandas as pd
import numpy as np
import pandas_profiling
cor = dataset.corr()
# transformation des données en Numpy arrays pour pouvoir utiliser dans le modèle
cible = np.array(dataset['E'])
print(cible)
56
list_var = list(dataset.columns)
list_var1 = list(dataset1.columns)
dataset = np.array(dataset)
# apprentissage
# création du RF à x arbres
max_features='auto', max_leaf_nodes=None,
min_impurity_decrease=0.0, max_samples=500,
57
x_test, y_test), rf.score(x_val, y_val)
print(r_train)
print(r_test)
print(r_val)
# ♠Test
predict = rf.predict(x_test)
print(predict)
# calcul de l'erreur
# MAE
# MAPE
# prediction
dataset1 = np.array(dataset1)
pred = rf.predict(dataset1)
print(pred)
pred=list(pred)
k=0
58
for i in range(13):
for j in range(9):
A[i, j],k=pred[k],k+1
print(A)
cbar=plt.colorbar(ac)
Tranchée 1
59
60
Tranchée 2
61
62