© Académie des sciences / Elsevier, Paris
Paléontologie / P a l a e o n t o l o g y
LE POINT SUR…
--------------CONCISE REVIEW PAPER
L'arbre de la vie a-t-il une structure fractale ?
Is the evolutionary tree a fractal structure?
Jean Chalinea*, Laurent Nottaleb, Pierre Grouc
a Laboratoires de Biogéosciences (UMR CNRS 5561) et Paléobiodiversité et préhistoire de l'EPHE,
Université de Bourgogne, Centre des Sciences de la Terre, 6 Bd. Gabriel, 21000 Dijon, France
b Département d'Astrophysique Extragalactique et Cosmologie (UMR CNRS 8631), Observatoire de
Paris, Section de Meudon, 92195 Meudon Cedex, France
c Université de Versailles-Saint-Quentin-en-Yvelines, 47 Bd. Vauban, 78280 Guyancourt, France
(Reçu le 30 Janvier 1999, accepté après révision le 5 avril 1999)
Abstract — We analyze the time sequences of major evolutionary leaps at various scales, from the scale
of the global tree of life, to the scales of orders and families such as sauropod dinosaurs, North American
fossil Equidae, rodents, and primates including the Hominidae. In each case we find that these data are
consistent with a log-periodic law to a high level of statistical significance. Such a law is characterized
by a critical epoch of convergence T c specific to the lineage under consideration and that can be
interpreted as the end of that lineage's capacity to evolve. (© Académie des sciences / Elsevier, Paris.)
tree of life / events / fractals / log-periodic law / spatio-temporal tree structure
Résumé — Les séquences temporelles des grands sauts évolutifs sont analysées à diverses échelles,
depuis celle de l'arbre global de la vie jusqu'à celle d'ordres ou familles telles que les dinosaures
sauropodes, les équidés fossiles d'Amérique du Nord, les rongeurs et les primates incluant les hominidés.
Dans tous les cas, nous trouvons que ces données peuvent être ajustées, avec une haute signification
statistique, par une loi log-périodique caractérisée par une époque critique de convergence Tc qui dépend de
la lignée considérée et qui peut s'interpréter comme la fin de la capacité d'évolution de cette lignée. (©
Académie des sciences / Elsevier, Paris.)
arbre de vie / événements / fractales / loi log-périodique / arborescence spatiotemporelle
______________________________________________
Article rédigé à l'invitation du Comité de lecture, sur le conseil de Jean Dorst.
*Correspondence et tirés à part:
[email protected]
C. R. Acad. Sci. Paris, Sciences de la terre et des planètes / Earth & Planetary Sciences,
1999. 328, 717-726
1
Abridged version
Introduction
The jumps between species (Gould et Eldredge, 1977; Chaline et al., 1993) involve
bifurcations allowing us to liken the general evolutionary process to a "tree of life" where
"branch" lengths represent time intervals between major events. The question raised in
this note is whether this tree can be described by a mathematical structure, at least at a
statistical level.
By analogy with real trees, we test as a first approximation the simplest possible law, i.e.
a self-similar tree. Such a law corresponds to discrete scale-invariance and log-periodic
acceleration, and has been suggested as describing various classes of phenomena
(notebooks of L. da Vinci published in 1942; Mandelbrot, 1975, 1982; Nottale, 1993;
Dubois et al., 1992, Plotnick et McKinney, 1993; Dubois, 1995; Solé et al., 1997,
Burlando, 1997, Kirchner et Weil, 1998; Sornette, 1998; Chaline, 1998, 1999).
A fractal tree model
Constructing the evolutionary law and calculating parameters
Let us consider a node in a tree where a branch divides into k sub-branches. Let us
assume that the total cross-section before (level n) and after (level n+1) the node is
preserved. If this section is bidimensional (as for example with conservation of sap
2
2
flow), this is reflected in the relationship between radii: k rn+1 = rn . But a more
general relationship can be considered by introducing a fractal dimension D : k rn+1D =
rnD. If we now accept that the tree is fully self-similar (still as a minimum simplifying
assumption), the ratio of branch lengths will then be equal to the ratio of their radii,
giving g = k1/D. As g >1, the total length measured along a given lineage is therefore
-1
-2
finite, as it is given by the converging infinite sum: L c = L 0 (1 + g + g + ...) =
g L0 / (g - 1). For a temporal tree, these "lengths" are given by the time interval between
two evolutionary events: L n = T n+1 - T n. Convergence of the above series therefore
means there is a critical time, Tc, marking the end of the evolutionary process for a given
lineage.
If we now take as the time origin the final critical time Tc, we can be sure self-similarity
is preserved, because the time interval ratios relative to this origin are always given by gn
(see equation (2) below).
Finally, the law to be tested in what follows can therefore be written:
2
Tn = Tc + (T0 – Tc ) g–n
(1)
where g = k1/D, with k an integer if the number of nodes remains constant at each stage.
This law is dependent on two parameters only, g and Tc, which of course have no reason
a priori to be constant for the entire tree of life. As regards g, we shall see that a
characteristic value nonetheless seems to emerge, but this could be simply a mean value
and/or the result of selective optimisation.
Calculating g
From paleontological data, the value of parameter g can be estimated from events taken
two by two, once the critical time is known:
g = (Tn – Tc ) / (Tn+1 – Tc ).
(2)
Calculating T c
For a given series with base g, the value of Tc may also be calculated from the two-bytwo ratios of dates of the events under consideration (see e.g. Sornette, 1998):
Tc(n, p) = (Tn – Tp g p–n ) / ( 1 – g p–n )
(3)
The stability of the value obtained can be used to test the validity of the law.
The law at different levels of analysis
We test this log-periodic evolutionary law at various levels of analysis: (i) the tree at a
global level (Delsemme, 1994), from the first appearance of life to viviparity (tables 1-2 ,
figures 1-2); (ii) sauropod dinosaurs (Lambert, 1983; Wilson et Sereno, 1998) (figure 3);
(iii) rodents (Chaline et Mein, 1979; Gould, 1997; Hartenberger, 1998) (figure 4); (iv)
the fossil Equidae (Chaline 1990) (table 3, figure 5); and (v) primates, including the
Hominidae (Chaline, 1998) (table 4, figure 6).
In each case we find that a log-periodic law provides a satisfactory fit for the distribution
of dates, with different values of the critical date T c for different lineages, but with
compatible values of the ratio g. The results are found to be of high statistical significance
(figure 7).
3
Discussion and conclusion
We end by discussing possible biases and uncertainties in our analysis and conclude that
they cannot explain the observed law, which therefore seems to be a genuine one.
Analysis of the values of the critical date for the various lineages leads us to interpret it as
a limit of the evolutionary capacity of the corresponding species. Such a law does not
mean that the role of chance in evolution is reduced, but instead that randomness may
occur within a framework which may itself be structured (in a partly statistical way).
______________________________________________________________________
1. Introduction
Apparues par des sauts brusques du patrimoine génétique, les espèces biologiques
peuvent évoluer graduellement ou rester en stase pendant de longues périodes et
s'éteindre individuellement ou à l'occasion de crises d'extinction en masse (Gould et
Eldredge, 1977 ; Chaline et al., 1993). Les sauts entre les espèces sont à l'origine de
bifurcations qui permettent d'assimiler le schéma évolutif global à un arbre de la
biodiversité, "l'arbre de la vie". Ainsi les noeuds de cet arbre peuvent être identifiés aux
grands sauts évolutifs, et les "longueurs" des branches aux intervalles de temps entre ces
événements majeurs. La question soulevée ici est la suivante : existe-t-il une (ou des)
loi(s) statistique(s) pour l'apparition de ces sauts, ou ceux-ci se font-ils d'une manière
totalement imprédictible ? En d'autres termes, l'arbre de la vie possède-t-il une structure
mathématique ?
Pour tenter de répondre à cette question, on remarquera tout d'abord que les arbres
végétaux, qui croissent suivant l'axe spatial vertical, sont caractérisés par des structures
auto-similaires de type fractal, une découverte que Mandelbrot (1975, 1982) attribue à
Léonard de Vinci [voir ses carnets publiés en 1942]. Nous éprouverons ici l'hypothèse
de travail suivant laquelle l'arbre de la vie, comme les arbres végétaux, possède une
structure mathématique fractale [voir aussi Nottale (1993)], en la confrontant aux
données paléontologiques.
Conscient du caractère extrêmement complexe que devrait revêtir une loi décrivant
tous les aspects multiples de l'arbre évolutif (dans l'hypothèse, étudiée ici sans a priori,
où une telle loi existe), nous partirons de la loi la plus simple possible, celle d'un arbre
auto-similaire et nous la confronterons aux données d'observation. Cette tentative doit
être interprétée comme une première approximation, qui n'a pas de raison d'être valide
pour tous les sous-ensembles de l'arbre. Nous montrerons en effet que certains des
paramètres de la loi obtenue varient suivant les embranchements étudiés (dinosaures,
rongeurs, équidés et primates).
4
Il faut rappeler que des structures fractales ont déjà été mises en évidence dans les
distributions statistiques de séries de spéciation et d'extinction, notamment chez les
rongeurs (Dubois et al., 1992), les foraminifères (Plotnick et McKinney, 1993), les
ammonites (Solé et al., 1997) et l'ensemble des organismes (Burlando, 1997). Il est
vraisemblable que les structures fractales résultent du fait que le vivant est organisé selon
une hiérarchie ascendante, une véritable échelle du vivant (Chaline, 1998, 1999).
Rappelons également que des lois log-périodiques ont été récemment proposées pour la
description de nombreux phénomènes, y compris d'évolution temporelle (Sornette, 1998;
Dubois, 1995). Kirchner et Weil (1998) ont critiqué le fait d'interpoler dans le temps les
événements, or cet argument avait été discuté et repoussé par Dubois et al. en 1992.
2. Un modèle d'arbre fractal
2.1. Construction de la loi d'évolution et calcul des paramètres
Considérons un point de bifurcation d'un arbre où une branche se divise en k sousbranches. Faisons l'hypothèse de la conservation de la section totale avant (niveau n) et
après la bifurcation (niveau n+1). Dans le cas où cette section est bidimensionnelle
(exemple de la conservation du flux de sève), ceci se traduit par la relation entre rayons:
k rn+12 = rn2. Mais une relation plus générale peut être considérée, introduisant une
dimension fractale D : k rn+1D = rnD. En admettant maintenant qu'il y a une complète
auto-similarité de l'arbre (toujours comme hypothèse simplificatrice minimale), le rapport
des longueurs des branches sera alors égal au rapport de leurs rayons, soit g = k 1/D.
Comme g >1, la longueur totale mesurée le long d'une lignée donnée est alors finie, car
-1
-2
elle est donnée par la somme infinie convergente: Lc = L0 (1 + g + g + ...) =
g L0 / (g – 1). Du point de vue d'un arbre temporel, ces "longueurs" sont données par
l'intervalle de temps qui sépare deux événements évolutifs: L n = T n+ 1 – T n . La
convergence de la série ci-dessus signifie alors qu'il existe une époque critique, Tc, qui
signe la fin du processus évolutif pour une lignée donnée.
Si l'on prend maintenant comme origine des temps l'époque critique finale Tc, on
s'assure que l'auto-similarité est conservée, car les rapports d'intervalles de temps
ramenés à cette origine sont toujours donnés par gn (voir équation 2 ci-dessous).
Finalement, la loi que nous allons éprouver dans la suite s'écrit donc :
–n
Tn = Tc + (T0 – Tc ) g
(1)
où g = k1/D , avec k entier si le nombre de branchements reste constant à chaque étape.
Cette loi ne dépend que de deux paramètres, g et Tc, qui n'ont bien sûr pas de raison a
priori d'être constants pour l'ensemble de l'arbre de la vie. En ce qui concerne g, nous
5
verrons néanmoins qu'une valeur caractéristique semble émerger, mais ceci pourrait
n'être qu'une moyenne et/ou le résultat d'une optimisation sélective.
2.2. Calcul de g
A partir des données fournies par la paléontologie, la valeur du paramètre g peut être
estimée à partir d'événements pris deux à deux, une fois l'époque critique connue :
g = (Tn – Tc ) / (Tn+1 – Tc ).
(2)
2.3. Calcul de T c
Pour une série à base g donnée, la valeur de Tc peut également être calculée à partir des
rapports deux à deux des dates des événements considérés (Sornette, 1998) :
Tc(n, p) = (Tn – Tp g p–n ) / ( 1 – g p–n )
(3)
La stabilité de la valeur obtenue permettra d'éprouver la validité de la loi.
2.4. Analyse statistique
D'une manière plus complète, nous déterminerons simultanément les valeurs de g et Tc à
partir des séquences de données observées, par un ajustement numérique (méthode des
moindres carrés). On utilisera comme estimateur statistique la variable t de Student
associée au coefficient de corrélation dans le diagramme [rang n de l'événement,
log(Tc – Tn) ]. Pour chaque valeur de Tc, on calcule les valeurs de g et de t. Les valeurs
optimisées de g et Tc correspondent alors au pic de la courbe t (Tc). Cependant, les rangs
des événements étant a priori classés dans l'ordre chronologique, le niveau de
signification statistique associé à une valeur donnée de t n'est pas celui d'une étude de
corrélation ordinaire. Des simulations Monte-Carlo ont donc été effectuées pour calibrer
cet estimateur en appliquant la même loi à des dates choisies au hasard et triées par ordre
chronologique. Les niveaux de probabilité donnés dans la suite sont déduits de cette
méthode.
3. La loi aux divers niveaux d'analyse
La difficulté majeure de cette étude réside dans la sélection des événements essentiels.
Nous tenterons de définir ou d'utiliser des critères objectifs, les plus indépendants
6
possibles de tout jugement de valeur, en particulier par le choix de critères physiques (par
exemple, changements de niveaux d'organisation: apparition de la vie, des noyaux, de la
pluricellularité; acquis fonctionnels : organes de locomotion, homéothermie, organes de
préhension...).
3.1. L'arbre global de la vie
Nous allons considérer dans un premier temps l'arbre de la vie, depuis son apparition, à
un niveau global, en étudiant l'une de ses "branches" principales menant aux
mammifères. Si l'on considère les mammifères vivipares actuels ils ont en commun une
structure physique interne qui s'est mise en place à la suite de sauts évolutifs majeurs. La
liste des dates de ces sauts est donnée dans le tableau I, d'après Delsemme (1994) dont
l'étude est antérieure et donc totalement indépendante de la recherche de loi faite ici.
Tableau I. Répartition des événements du transect de l'arbre de vie jusqu'à
l'apparition des primates (d'après Delsemme, 1994, complété par la viviparité).
Distribution of events on the evolutionary tree until the appearance of primates [after Delsemme (1994),
completed by viviparity].
_______________________________________
Evénements
Dates évaluées (Ma)
_____________________________________________
1 - Apparition de la vie
–3500 ± 400
2 - Eucaryotes (noyaux)
–1750 ± 250
3 - Pluricellularité
–1000 ± 100
4 - Exosquelettes
– 570 ± 30
5 - Tétrapodie
– 380 ± 30
6 - Homéothermie
– 220 ± 20
7 - Viviparité
– 120 ± 20
8 - Primates
– 65 ± 5
______________________________________________________
Ces dates témoignent d'une accélération log-périodique bien marquée (figures 1 et 2).
On trouve une époque critique Tc = -15 (+40, -20) Ma, où l'erreur est la demi largeur à
mi-hauteur de la courbe t (Tc), qui est ici asymétrique. Sur le même intervalle, on trouve
g = 1.81±0.07. La valeur maximale du t de Student est t = 52. Ce résultat est
statistiquement hautement significatif (probabilité P < 10-3 d'obtenir un tel résultat par
hasard).
7
dates prévues (milliards d'années)
exosquelettes
-8
1
2
3
4
5
primates
viviparité
homéothermie
tétrapodie
-7
eucaryotes
-6
apparition de la vie
-5
-55 Ma
-150 Ma
-400 Ma
-1.1 Ga
dates observées
-ln (Tc - T)
-4
pluricellularité
-3.1 -1.8 -1.0 -0.6 -0.34 -0.2 -0.11 -0.06
-3.0 Ga
6
7
8
rang de l'événement
Figure 1. Répartition log-périodique des sauts évolutifs majeurs jusqu'à l'apparition
des primates. (On a pris ici T c = 2.3 Ma et g = 1 . 7 3 ) .
Log-periodic distribution of major evolutionary leaps until the appearance of primates (Here Tc = 2.3 Ma
and g = 1.73).
Pour compléter ces résultats, nous allons maintenant étudier statistiquement la
structure plus globale de l'arbre. Notre choix correspond au consensus général de la
chronologie des événements novateurs de la vie, depuis ses origines jusqu'aux
mammifères (tableau II) :
Tableau II. Répartition des événements novateurs de l'histoire de la vie jusqu'à la
séparation des Placentaires.
Distribution of innovative evolutionary events until the separation of placental mammals.
Evénements
Dates (Ma)
- Apparition de la vie – stromatolithes (= cyanobactéries photosynthétiques)
Eobacterium isolatum
– 3400 ± 500
- Accumulation de fer rubanné: production d'oxygène
– 2000 ± 200
- Premier eucaryote identifié: acritarches / algues
– 1800 ± 500
- Premier eucaryote multicellulaire identifié (Grypania) ?
– 1100 ± 200
- Disparité des "crown eucaryotes" (Metazoa, Fungi, algues vertes, rouges,
brunes, etc...)
– 1000 ± 200
- Diminution du CO2 – glaciations : réduction des bactéries, Cnidaires,
diploblastiques
– 600 ± 200
- Disparité des Métazoaires: éponges, arthropodes, mollusques, échinodermes,
sque1ette minéralisé externe, carapace, etc...)
– 550 ± 30
- Apparition du squelette interne:
plus ancien vertébré agnathe (Hétérostracé)
– 500 ± 50
8
- Premiers gnathostomes (Placoderme)
- Premiers tétrapodes pulmonés (Ichthyostega)
- Premier reptile : Westlothiana (oeuf cléidoïque)
- Premier reptile mammalien (homéothermie ?)
- Premier mammifère : (Diarthrognathus-Morganucodon)
- Viviparité (Marsupiaux et Placentaires)
–
–
–
–
–
–
410 ± 30
380 ± 20
350 ± 10
290 ± 10
225 ± 5
120 ± 20
Ces dates sont reportées sur la figure 2. Elles sont complétées par:
- trois événements majeurs antérieurs à l'apparition de la vie sur Terre mais essentiels
pour les conditions de son apparition: l'origine de l'univers (–16000 ± 2000 Ma),
l'enrichissement en éléments "lourds" (C, N, O) du milieu interstellaire (-11000 / -7000
Ma) et la formation du Système Solaire (-4600 Ma).
- les dates des grands événements de l'évolution des primates, incluant l'hominisation.
Elles sont alors comparées à celles que l'on peut calculer à partir de la loi Tn = (2.3 –
16000 / 1.73n) Ma (cf § 3.5). L'accord statistique est remarquable: l'histogramme des
écarts δn entre log1.73(16000) –log1.73(Tc–Tn) et l'entier le plus proche est fortement
piqué autour de zéro, ce qui confirme qu'il apparaît une authentique "quantification".
L'écart à une distribution uniforme de cet histogramme est caractérisé par un χ2 = 64.2
-9200
-5300
-3080
-1780
-1030
-590
-340
-200
-110
-63.5
-35.7
-19.6
-10.4
-5.0
-1.9
-0.14
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Figure 2. Comparaison entre les valeurs de log 1 . 7 3 ( T c – T n ) pour les grands
événements de l'évolution (y compris l'hominisation et les périodes
"cosmologiques") et la distribution des nombres entiers. On a pris T c = +2.3
millions d'années. La probabilité d'obtenir une telle distribution par hasard est
inférieure à 10 -9 .
Comparison of log1.73(Tc–Tn) values for the major evolutionary events (including hominization and
"cosmological" times) and the distributions of integers. Here Tc = +2.3 Ma. The probability of obtaining
such a distribution by chance is less than 1 in 109.
3.2. Les dinosaures
Nous allons tenter maintenant d'appliquer la même analyse aux dates d'apparition des
familles de dinosaures. Si l'on prend en compte toutes les dates relevées par Lambert
(1983), on ne détecte aucune accélération. Mais évidemment ces dates constituent un
9
+0.89
-16000
dans 10 intervalles, ce qui correspond à une probabilité P < 10–9 d'être issu d'une
distribution uniforme.
ensemble hétérogène, qui correspond à un mélange de "noeuds" de l'arbre de rangs
différents. On ne peut travailler vraiment que si l'on possède la structure en arbre.
Les données de Wilson et Sereno (1998) recalibrées d'après Odin (1994) sur les
sauropodes sont bien adaptées à cette étude, car ils utilisent un critère morphologique
rigoureux et ils ont pu reconstituer un arbre évolutif. Dans leur cas l'accélération est très
marquée, bien visible sur leur cladogramme. Ils ont identifié 5 événements essentiels
(sauropoda, eusauropoda, neosauropoda, titanosauriformes, titanosauria) correspondant
à des dates d'apparition que l'on peut estimer à {-230, -200, -180, -165, -157} Ma. On
trouve pour ces dates (figure 3) Tc = -139 (-6,+9) Ma et g = 1.5±0.1, résultat hautement
significatif (t =70, P <2/1000). En prenant l'échelle de temps choisie par Wilson et
Sereno, des dates légèrement différentes peuvent être estimées {-230, -208, -182, -167,
-156} Ma (voir leur figure 46), qui donnent Tc = –122 Ma, g = 1.33, et t = 101.
dates prévues (millions d'années)
-4
-4.5
0
1
2
3
-157
-159
4
Titanosauria
Sauropoda
-ln (Tc - T)
-3.5
-166
-172
-194
-229
5
dates observées (Ma)
-3
Eusauropoda
-2.5
-179
Titanosauriformes
-200
Neosauropoda
-230
6
rang de l'événement
Figure 3. Ajustement des dates des principaux sauts évolutifs des sauropodes par une
loi log-périodique définie par T c = -139 Ma et g = 1.5.
Fit of dates of main evolutionary leaps for sauropods against a log-periodic law with Tc = -139 Ma and g
= 1.5.
Ce résultat joue un rôle important pour l'interprétation de l'époque critique Tc. En
effet, il n'y a plus aucun événement d'apparition de groupes après -156 Ma, beaucoup de
ces espèces (Diplodocus, Brachiosaure, Titanosaure), non seulement ne disparaissent
pas, mais au contraire restent stables jusqu'a la disparition globale du groupe à -65 Ma.
Le Tc semble donc devoir être interprété comme la fin de la capacité évolutive, lorsque la
structure se fige et ne peut plus évoluer, et non a priori comme une disparition.
10
3.3. L'ordre des rongeurs
Il était intéressant de considérer le cas d’un groupe possèdant une forte biodiversité, pour
laquelle on attendrait qualitativement une forte capacité évolutive (Gould, 1997). L’ordre
des rongeurs, le plus grand ordre de mammifères puisqu'à lui seul il rassemble la moitié
des espèces de ce groupe (Chaline et Mein, 1979), nous fournit un tel cas, pour lequel on
s'attend donc à une époque critique plus élevée que dans le cas des primates (le Tc des
primates est de +2.3 Ma). Cette prédiction se trouve effectivement vérifiée.
La complexité de l’arborescence des rongeurs, dont la radiation se réalise entre le
Paléocène supérieur, il y a plus de 55 Ma, et l'époque actuelle, fera l'objet d'une étude
plus complète. Nous nous contenterons dans la présente étude simplifiée, à titre de
comparaison avec les autres lignées, d'analyser les pics de la distribution de l'ensemble
des dates d'apparition dans l'arbre des rongeurs selon les données de Hartenberger
(1998). Une estimation possible de ces dates et de leur rang est : ( {-50,1}, {-35,2}, {26,3}, {-17,4}, {-12,5}, {-7,6},{-2,7} ) qui donne un meilleur ajustement avec Tc =
+12 ± 6 Ma, t = 46 (figure 4, N = 7, P < 10-3). Un choix un peu différent ({-54,1},{43,2},{-35,3},{-27,4},{-18,5},{-12,6},{-7,7},{-2,8}) donne Tc = +35 ± 15 Ma et t =
80 (N = 8, P < 2 10-4). Suivant les sous-ensembles considérés de cet ordre, on trouve un
Tc grand (variant entre +10 Ma et +60 Ma), toujours supérieur à celui des primates et des
-4
0
1
2
3
4
5
pic à -2 Ma
pic à -7 Ma
pic à -26 Ma
pic à -12 Ma
-3.5
pic à -35 Ma
pic à -50 Ma
-ln (Tc - T)
-3
0
-8
-21
-43
6
7
dates observées (Ma)
-2.5
pic à -17 Ma
équidés américains, en accord avec notre conjecture initiale.
8
rang de l'événement
Figure 4. Ajustement des pics de densité dans la distribution des dates d'apparition
d'espèces de l'ordre des rongeurs, par une loi log-périodique de T c = +12 Ma et g =
1.28.
Fit of density peaks in distribution of rodent species appearances against a log-periodic law with Tc =
+12 Ma and g = 1.32.
11
3.4. La famille des Equidés fossiles d'Amérique du Nord
L'évolution des équidés fossiles en Amérique du Nord est un exemple qui concerne une
diversification partielle au niveau d'une famille de mammifères. On trouve des sauts
correspondant à l'apparition des principaux genres aux dates suivantes (tableau III) :
Tableau III. Chronologie de l'apparition des genres dans l'histoire des Equidés en
Amérique du Nord [selon des données originales de Devillers in Chaline 1990].
Evolutionary chronology of North American equid genera [after original data by Devillers in Chaline
1990].
Genres
Hyracotherium
Orohippus
Epihippus
Mesohippus
Miohippus
Parahippus
Kalobatippus (= Anchitherium archaïque)
Archaeohippus
Merychippus
Hipparion
Protohippus
Nannipus
Plesippus
Equus
Extinction dEquus
Ages en Ma
– 54 ± 5
– 50 ± 5
– 47 ± 5
– 38 ± 5
– 31 ± 5
– 24 ± 4
– 24 ± 4
– 19 ± 3
– 19 ± 3
– 15 ± 3
– 11 ± 2
– 9±2
– 6±2
– 2±1
– 0.010
Pour l'analyse de ces données, il nous faut rappeler que notre étude ne porte pas sur
les événements en eux-mêmes, mais sur la répartition de leurs dates. Ainsi, aux
incertitudes près (±10%), les 3 premiers événements n'en forment qu'un, ce qui est
cohérent avec le fait que ces trois premières étapes se réalisent de façon graduelle, sans
doute au sein d'un seul et même génome. On vérifie que l'apparition des genres
s'effectue selon une loi log-périodique (figure 5) : on trouve pour N = 9 points (répartis
de -54 à -6 Ma sans discontinuité) que le meilleur ajustement correspond à une pente g =
1.30 ±0.05, et une époque critique T c = 0.4 ± 4 Ma. Le t de Student associé à cet
ajustement est de 39.8 (P<10-3). En gardant l'événement à -2 Ma, on trouve g = 1.30 ±
0.03, Tc = 0.3 ± 1 Ma, t = 60 (P < 10-3).
12
dates prévues (millions d'années)
-54
-31
-18
-10.4
-6.0
-3.5
-2.0
-1
Plesippus
Nannipus
Equus
Protohippus
Hipparion
Parahippus
Miohippus
Mesohippus
-3
Hyracotherium
-ln (Tc - T)
-2
-3
-10
-30
dates observées (Ma)
-1
Archaeohippus
0
-4
0
2
4
6
8
10
12
rang de l'événement
Figure 5. Dates d'apparition des genres d'équidés en Amérique du Nord, comparées à
une loi log-périodique avec T c = 0 et g = 1.32 (les points de même couleur sont
dans un rapport 1.73 : à comparer avec les diagrammes équivalents pour les primates
et l'évolution globale).
Appearance dates of North American equid genera compared with a log-periodic law with Tc = 0 and g =
1.32 (like colored dots are in ratio 1.73 - to be compared with the equivalent diagrams for primates and
general evolution).
Il faut remarquer que l'accord n'est possible que s'il manque 3 dates entre –6 et –2
Ma. On prédit donc l'existence de trois événements supplémentaires entre ces deux
époques qui n'ont pas été retenus dans le tableau établi à partir des données de Devillers
in Chaline (1990), à -4.6, -3.5 et -2.6 Ma, et qui pourraient manquer dans les données
paléontologiques actuelles.
Notons en outre que le genre Equus disparaît en Amérique du Nord (où les équidés
ont été réintroduits par les conquistadors) il y a environ 10.000 ans avec de nombreuses
autres espèces de mammifères. Notre résultat est en accord avec cette date d'extinction.
3.5. L'ordre des Primates
Les dates des grands événements de l'histoire des primates (incluant l’hominisation) sont
données dans le tableau IV (en Ma). Ces dates sont très bien ajustées par une loi logpériodique (N = 7, t = 71.0, P = 2 10-4) de g = 1.736 ± 0.013 et de T c = 2.25 ± 0.8
Ma. Si l'on rajoute les deux événements majeurs que sont l'apparition de mammifères et
des placentaires (voir tableau I), on trouve un ajustement encore meilleur: Tc = 1.9 ± 0.4
Ma (N = 9, t = 160, P << 10-4). La figure 6 montre la comparaison entre les dates
observées et la loi log-périodique correspondante.
13
Tableau IV. Grands événements de l’histoire des primates. La colonne 3 donne les
valeurs de T c estimées à partir des couples de dates 1 et n. Elles convergent vers 2.3
Ma vers le futur. A partir de cette valeur de T c , on peut ensuite calculer les valeurs
de g à partir des événements pris 2 à 2. Les valeurs correspondantes sont reportées
dans la colonne 4. On notera là encore leur grande stabilité: la moyenne est 1.73 ±
0.04. Cette stabilité signifie que, par exemple, les valeurs des 3 dernières dates
peuvent être prédites très précisément à partir des 4 premières, ou encore que la date
4 (qui n’est pas d’origine paléontologique mais est déterminée à partir des
estimations de distances génétiques) peut être rétro-prédite par cette loi (prédiction
-10.5 Ma) .
Major events in primate evolution. Column 3 shows Tc values estimated from date pairs 1 and n. They
converge around 2.3 Ma in the future. Using this Tc value, g values can be calculated from events taken
two by two. Corresponding values are shown in column 4. Notice their stability: mean value 1.73 ±
0.04. This stability means that the values of the last three dates, say, can be predicted very precisely from
the first four, or that date 4 (which is not derived from paleontology but from estimated genetic distances)
can be reverse-predicted by this law (prediction -10.5 Ma).
Evénements
Dates en Ma
T c (1,n)
g
1 - Premier primate
2 - Premier ancêtre anthropoïde
3 - Proconsul
4 - Ancêtre commun P/G/H
5 - Australopithèque
6 - Premier Homo
7 - Homme moderne H. sapiens
–65 ± 5
–40 ± 5
–20 ± 2
–10 ± 1.5
–5±1
– 2 ± 0.3
–0.18 ± 0.02
+5.8
+2.5
+3.1
+2.5
+2.3
+2.3
1.59
1.90
1.81
1.68
1.70
1.72
dates prévues (millions d'années)
0
1
2
3
4
5
6
rang de l'événement
homme moderne
0
-1
premier homo
ancêtre PGH
-4
+1
australopithèque
-3
proconsul
primates
-ln (Tc - T)
-2
-20 -10.6 -5.1 -2.0 -0.2 +0.9
-5
-10
-20
dates observées
-1
-36
ancêtre anthropoïdes
-114 -65
0
-50
-100
7
8
Figure 6. Comparaison entre les dates observées des grands événements de l'histoire
des Primates (points) et une loi log-périodique de rapport g = 1.73 et d'époque
critique T c = +2.3 millions d'années. Le point ouvert correspond à la prédiction
issue de cette loi concernant la date du prochain événement évolutif pour cette
lignée.
Comparison of dates of major events in primate evolution (dots) and a log-periodic law of ratio g = 1.73
and critical time Tc = +2.3 Ma. The ring marks the date for the next evolutionary event for the lineage
as predicted by the law.
14
4. Discussion
Les résultats obtenus sont synthétisés dans la figure 7. Le caractère partiellement prédictif
de notre modèle est évident, à deux niveaux : celui de la structure chronologique de
l'arbre de la vie et celui des dates des sauts évolutifs à venir. Avant de développer ce
point, il est cependant nécessaire de discuter des biais possibles.
3.48
Tc = +12 Ma
1.47
1.80
viviparité
Tronc commun
tétrapodie
apparition de la vie
Rongeurs
Primates
Tc = +2.3 Ma
1.84
2.04
2.76
1.14
1.12
0.40
Tc = -10±30 Ma
Equidés
Tc = -2 Ma
1.32
1.68
0.96
Sauropodes
Tc = -140 Ma
1.95
1.23
1.59
Figure 7. Résumé des principaux résultats de la présente étude. Nous y avons reporté
les dates (voir tableaux) des événements marquants de: (i) l'histoire "globale" de la
vie ("tronc commun": noter que, strictement, il s'agit déjà d'une branche
particulière, la partie "tronc" ne correspondant qu'au premier intervalle, entre
l'apparition de la vie et la première ramification en eucaryotes, procaryotes et
archaea); (ii) des dinosaures sauropodes, et (iii) des trois lignées de mammifères
étudiées ici à titre d'exemple, rongeurs, primates et équidés. Les valeurs des dates
sont reportées en échelle logarithmique ramenée à leur date critique, c'est-à-dire
log(T c -T ). L'époque critique T c ajustée pour chaque lignée est indiquée sur la droite,
en millions d'années à partir du présent. La répartition log-périodique (en moyenne)
des événements est clairement apparente sur ce diagramme.
Summary of the main findings of this study. We have plotted the dates (see tables) of major events of: (i)
general evolution of life ("common trunk": notice that this is strictly already a separate branch, with the
"trunk" being just the first interval between the appearance of life and the initial division into eucaryotes,
procaryotes and archaea); (ii) sauropod dinosaurs, (iii) the three lineages of mammals studied here as
example, i.e. rodents, primates and equids). The numerical values of the dates are given in terms of a
logarithmic scale based on their critical date, i.e. log (T c -T). The critical time T c adjusted for each
lineage is indicated on the right in millions of years from the present. The (mean) log-periodic
distribution of events appears clearly from the diagram.
4.1. Biais de perspective
Le principal problème concernant l'établissement d'une telle loi est le biais qui vient de la
difficulté croissante d'obtenir des fossiles à des époques de plus en plus reculées et de
l'accroissement de la barre d'erreur sur leur date (effet de "perspective"). Ce biais
15
pourrait se traduire par une incertitude δT/T pratiquement constante sur les dates des
événements considérés, ce qui est, effectivement, pratiquement le cas en ce qui concerne
la présente étude, et par une densité d'événements constante, non au cours du temps T,
mais suivant la variable log T.
Réduire la loi obtenue à un tel biais nous semble cependant impossible. En effet, si la
loi n'était que la conséquence de ce biais :
- il faudrait que l'incertitude sur les dates atteigne ± 35% (Primates et évolution globale),
ce qui semble grandement exagéré par rapport aux 10% généralement adoptés, qui
semblent s'accorder avec les variations des estimations suivant les auteurs.
- la loi de log-périodicité ne devrait être qu'une loi moyenne, et l'on ne devrait avoir
aucune concentration des points observés autour des points prévus. Or, dans tous les
cas, y compris l'évolution "globale", on obtient un regroupement à haute signification
statistique autour des dates des événements prévus.
- la valeur de l'époque critique artificielle que l'on calculerait devrait être l'époque
actuelle, Tc = 0. Ceci est le cas, aux barres d'erreur près (très larges, ±30 Ma), en ce qui
concerne l'évolution "globale" jusqu'à l'homéothermie (N = 8, T < 200 Ma), ainsi que
les Equidés fossiles américains (mais dans ce dernier cas le résultat Tc = 0 est une rétroprédiction vérifiée par les observations). Dans tous les autres cas, la valeur du Tc obtenu
est significativement différente de zéro, et montre une haute stabilité autour de sa valeur
quels que soient les sous-ensembles d'événements considérés (c'est le cas par exemple
du Tc = +2.3 Ma pour les primates, cf tableau IV).
- le cas des dinosaures sauropodes, où les dates s'échelonnent entre -230 Ma et -156 Ma
et convergent vers -139 Ma, exclut quant à lui tout effet de perspective.
Nous concluons que ce biais, bien que jouant sans doute un rôle dans l'analyse des
données, ne saurait expliquer cette loi, que nous interprétons donc comme une
authentique structuration de l'arbre de la vie.
4.2. Le modèle trichotomique
Une des questions que nous n'avons pas abordées est celle de la valeur des coefficients g
obtenus. Dans le cadre d'un modèle d'arborescence régulier, nous avons vu qu'on
s'attendait à ce qu'ils soient liés au nombre d'embranchements k et à la dimension D par
la relation g = k1/D. Or les valeurs obtenues sont toutes compatibles avec g =31/2 ou sa
racine (qui correspond à une densité double de points). Ainsi les données combinées des
tableaux I et IV conduisent à g = 1.73 ± 0.03. Nous sommes donc amenés à faire la
conjecture qu'au moins certains sous-ensembles de l'arbre se caractériseraient par un
nombre d'embranchements moyen k = 3 et une dimension D = 2.
16
Inversement il semble probable que certaines explosions évolutives comme celle du
Cambrien ont donné un nombre d'embranchements supérieurs, mais seuls comptent
finalement ceux qui restent après l'action de la sélection naturelle.
On peut également faire la conjecture que la valeur de D soit liée à la partie spatiale de
l'arbre et donc que D = 2 manifeste le caractère essentiellement bi-dimensionnel de la
biosphère. Ceci pourrait être éprouvé par des études futures de lignées moins soumises à
cette contrainte (par exemple, répartition localement tridimensionnelle).
4.3. Validité des prédictions
On peut enfin utiliser la loi obtenue pour prédire l'époque du prochain saut majeur de
même ampleur que l'apparition de l'homme moderne (Homo sapiens). On le trouve à
≈0.8 Ma vers le futur, ce qui fixerait à environ 1 Ma la période totale où l'homme
moderne représente la phase la "plus" évoluée de la biosphère. Quelle valeur attribuer à
une telle prédiction ? On peut évidemment s'interroger sur les perturbations que risque
d'apporter à cette loi (si sa validité se confirmait) le fait même de la connaître... En outre
l'homme devenant maître de son évolution risque de la modifier par son action. Il est
néanmoins remarquable que l'homme moderne semble apparaître dans la loi obtenue
comme un noeud intermédiaire et transitoire, mais a priori pas comme une limite.
Inversement, il faut aussi prendre en compte les effets de taille finie, comme dans le
cas par exemple de la prédiction par des lois log-périodiques des cracks boursiers ou des
tremblements de terre [voir Sornette (1998)], où l'époque de divergence théorique ne
peut être qu'une limite supérieure pour l'époque de crise réelle. Un problème ouvert est
donc la détermination du seuil, soit sur les valeurs d'une variable divergente (indice
boursier pour les cracks, concentration d'ions pour les tremblements de terre...), soit sur
les écarts de plus en plus petits entre crises secondaires, à partir duquel on entre
réellement dans la crise finale. C'est ainsi que, à l'échelle de l'intervalle total d'évolution
de la vie sur Terre, soit environ 3.5 milliards d'années, il n'est pas du tout impossible
qu'une séparation entre grands sauts évolutifs qui ne serait plus que de 1 million
d'années seulement corresponde au dépassement d'un tel seuil. Dans ce cas, l'apparition
de l'homme moderne pourrait être considérée comme la crise finale pour notre lignée :
mais il n'y a pas de raison qu'il en soit de même pour l'ensemble de l'arbre, comme
l'indique par exemple l'obtention d'un Tc plus éloigné dans le futur pour les rongeurs.
Cette loi ne doit pas être interprétée de façon finaliste. L'existence d'une telle loi ne
peut s'expliquer, à notre avis, que par l'existence de structures de l'arbre évolutif pris
globalement. C'est en poursuivant cette étude par une analyse détaillée de l'ensemble de
l'arbre que le sens des lois obtenues pourra apparaître clairement.
Il faut également se garder de mal ou trop hâtivement interpréter la signification de
l'époque Tc (et donc de pousser trop loin l'analogie avec les vrais arbres). Il s'agit de la
17
date d'une "crise" majeure pour la lignée considérée et d'après les données des
dinosaures, il pourrait s'agir de la perte des potentialités évolutives, ce qui ne signifie pas
extinction immédiate. De plus, la fin d'une loi n'est pas la fin de toute loi, mais peut être
la transition vers une loi nouvelle. Il faut insister également sur le fait que nulle part, dans
la détermination de la loi obtenue, la nature des événements n'est intervenue : seules leurs
dates ont été prises en compte.
Si cette loi empirique est confirmée ultérieurement, une conséquence potentiellement
importante doit être soulignée : la loi implique que les divers groupes zoologiques, ayant
un Tc différent, ont des durées d'existence distinctes et limitées. Il est clair que s'il faut se
garder d'interpréter systématiquement l'époque critique comme celle d'une extinction
définitive, il n'en reste pas moins vrai que cette propriété de convergence temporelle
fournit un cadre nouveau de compréhension de certaines extinctions de groupes (en
dehors des accidents conduisant à des extinctions massives d'origine environnementale).
Ceci a été illustré par notre étude des équidés fossiles d'Amérique du Nord, effectivement
disparus à la date critique (aux barres d'erreur près), prédite à partir de dates beaucoup
plus anciennes. Il sera intéressant d'appliquer ce type d'analyse à d'autres groupes, ce
que nous ferons dans un travail futur.
5. Conclusion
Les résultats obtenus nous ont permis de valider notre hypothèse de travail initiale, selon
laquelle la représentation d'un arbre fractal peut être transposée dans le domaine
temporel. L'arbre de vie dans tous ses détails pourrait se révéler plus complexe qu'un
arbre végétal. Mais le point essentiel développé ici est l'idée qu'une description
quantitative en terme de structure fractale est possible, à condition d'aller au delà de la
self-similarité stricte (Nottale, 1997).
La loi obtenue semble impliquer l'existence d'un déterminisme sous-jacent à l'évolution
au niveau structurel, qui ne remet pas en compte son indéterminisme profond dû à la
contingence (Gould, 1997), sachant qu'elle n'apporte aucune prévision de la nature des
événements. C'est une loi qui possède néanmoins un certain niveau de prédictibilité au
niveau chronologique et qui peut donc être testée, même si les prédictions dans le
domaine de la paléontologie relèvent du très long terme.
Remerciements. Nous remercions J.-L. Hartenberger pour les données inédites qu'il a
bien voulu nous communiquer, Y. Bouligand, F. Cézilly, B. David, J. Dercourt, J.L.
Dommergues, J. Dubois, F. Magniez, S. Montuire, M. Remoissenet, D. Sornette et E.
Verrecchia pour leurs critiques et de très utiles discussions.
18
RÉFÉRENCES
---------------------------------------------------------------------------------------------------------
Burlando B. 1997. The fractal geometry of evolution, J. Theor. Biol., 163, 161-172.
Chaline J. 1990. Paleontology of Vertebrates, Springer-Verlag, New-York, 186p.
Chaline J. 1998. Vers une approche globale de l'évolution des Hominidés, Le Point
sur..., C. R. Acad. Sci. Paris, 326 (3II), 307-318.
Chaline J. 1999. Les Horloges du vivant, Hachette, Paris, 236p.
Chaline J. et Mein P. 1979. Les rongeurs et l'évolution, Doin, Paris, 235p.
Chaline J., Laurin B., Brunet-Lecomte P. et Viriot L. 1993. Morphological trends and
rates of evolution in Arvicolids (Arvicolidae, Rodentia) at species level : toward a
Punctuated Equilibria/Disequilibria Model, in : Chaline J. et Werdelin L. (éds.), Modes
and tempo of Evolution in the Quaternary, Quaternary International, 19, 27-39.
Delsemme A. 1994. Les origines cosmiques de la vie, Flammarion, Paris, 382p.
Dubois J. 1995. La dynamique non linéaire en physique du globe, Masson, Paris, 265p.
Dubois J., Chaline J. et Brunet-Lecomte P. 1992. Spéciation, extinction et attracteurs
étranges, C. R. Acad. Sci. Paris, 315(II), 1827-1833.
Gould S.J. 1997. L'éventail du vivant, Le Seuil, Paris, 304p.
Gould S.J. et Eldredge N. 1977. Punctuated equilibria: the tempo and mode of evolution
reconsidered, Paleobiology, 3(2), 115-151.
Hartenberger J.-L. 1998. Description de la radiation des Rodentia (Mammalia) du
Paléocène supérieur au Miocène ; incidences phylogénétiques, C. R. Acad. Sci. Paris,
316(II), 439-444.
Kirchner J.W. et Weil A. 1998. No fractals in extinction statistics, Nature, 395, 337338.
Lambert D. 1983. Collins Guide to Dinosaures, Collins, Hong-Kong, 256p.
Mandelbrot B.B. 1975. Les Objets Fractals, Flammarion, Paris, 203p.
Mandelbrot B.B. 1982. The Fractal Geometry of Nature, Freeman, San Francisco,
460p.
Nottale L. 1993. Fractal Space-Time and Microphysics: Towards a Theory of Scale
Relativity, World Scientific, Singapour, 333p.
Nottale L. 1997. Scale Relativity, in Scale Invariance and Beyond, eds. B. Dubrulle, F.
Graner & D. Sornette, EDP Sciences / Springer, 249-261.
Odin S. 1994. Geological Time Scale, Le Point sur..., C. R. Acad. Sci. Paris, 318 II(1),
59-71.
Plotnick R.E. et McKinney M. 1993. Evidence of self-organization in planktic
foraminiferal evolution: implications for interconnectedness of palaecosystems, Palaios,
8, 202-212.
19
Solé R.V., Manrubia S.C., Benton M. et Bak P. 1997. Self-similarity of extinction
statistics in the fossil record, Nature, 388, 764-767.
Sornette D. 1998. Discrete scale invariance and complex dimensions, Physics Reports,
297, 239-270.
Vinci L. de. 1942. Les Carnets de Léonard de Vinci, 1. Botanique, I, Gallimard, Paris,
323.
Wilson J.A. et Sereno P.C. 1998. Early Evolution and Higher-level Phylogeny of
Sauropod Dinosaurs, Journal of Vertebrate Paleontology, 2(18), 1-68.
20
View publication stats