Chapitre 1

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 7

Chapitre1 :

Diversité génétique et Constitution génétique des populations


Définitions & Mesure

I. Introduction
La génétique initiée par Gregor Mendel, appelée classiquement génétique Mendélienne, a pour
objectif de comprendre le déterminisme et la transmission des caractères par l’analyse de la
descendance d’un croisement contrôlé entre individus de génotypes différents.
Après la découverte du support de l’information génétique (ADN), la génétique moléculaire
continue à rechercher les mécanismes fins du déterminisme, de l’expression et de la transmission
des caractères. Elle trouve aujourd’hui de nombreuses extensions avec les programmes de
génomique (séquençage des génomes et identification des gènes).
La compréhension du déterminisme et de la transmission des caractères doit aussi étudier les
individus dans les conditions naturelles ou ils sont génétiquement uniques et libres de se
reproduire avec n’importe quel autre individu de la même espèce. Cette partie de la génétique, qui
considère les individus en interaction avec leur environnement, est la génétique des populations.

1-Définitions et objectifs
La génétique des populations étudie la variabilité génétique présente dans et entre les populations
avec trois principaux objectifs :
-Mesurer la variabilité génétique, appelée aussi diversité génétique ou polymorphisme génétique,
par la fréquence des différents allèles d’un même gène.
- Comprendre comment la variabilité génétique se transmet d’une génération à l’autre.
- Comprendre comment et pourquoi la variabilité génétique évolue au fil des générations.

Si la génétique Mendélienne se base sur des croisements contrôlés par un expérimentateur, la


génétique des populations étudie les proportions des génotypes au sein d’un ensemble d’individus
issus des croisements non contrôlés entre de nombreux parents. C’est donc une application des
principes de base de la génétique mendélienne à l’échelle des populations.

2- Qu’appelle-t-on une population


Une population est l’ensemble des individus de la même espèce vivant sur un territoire bien
déterminé et qui ont la possibilité d’interagir entre eux au moment de la reproduction.
La population représente une communauté génétique constituée par l’ensemble des génotypes
des individus qui la composent. La population se caractérise donc par un génome collectif ou
patrimoine génétique, appelé aussi pool génétique qui est la somme des génotypes individuels
pour chacun des gènes. Si chaque génotype individuel est fixé définitivement à la naissance et
cesse d’exister à la mort de l’individu, le pool génétique d’une population présente une continuité
à travers les générations, et peut varier au cours du temps. C’est cette évolution que la génétique
des populations cherche à comprendre.
Les populations ne sont jamais génétiquement closes, car elles subissent l’apport de nouveaux
allèles soit par mutation, soit par migration, soit par sélection. Ces facteurs ont pour
conséquences une variation de la fréquence des allèles au cours des générations successives. Ces
changements, appelés changements micro-évolutifs ou microévolution, modifient la structure
génétique de la population qui peut ou non évoluer vers une meilleure adaptation à son
environnement.
Il est nécessaire d’abord d’étudier le cas particulier où aucune force évolutive n’intervient, c’est la
population idéale.

1
3- Modes de reproduction
-Union au hasard, pas de choix de conjoint : Panmixie= Pangamie
-Union entre individus apparentés : Consanguinité et Autofécondation
-Union entre individus ayant des ressemblances (ou dissemblances) phénotypiques et
génotypiques : Homogamie et Hétérogamie.

II. Description génétique d’une population


Une population mendélienne peut être caractérisée par les fréquences phénotypiques,
génotypiques et alléliques pour un caractère qualitatif simple.
Dans une population mendélienne diploïde, on considère un caractère qualitatif, autosomal et
contrôlé par un couple d’allèles (A, a) sans dominance absolue.

Soit f(A) =p et f(a)= q avec p+q =1


Si on part de N individus, on aura 2N allèles.

Soient :
Le phénotype [AA] : n1 individus → 2n1 allèles
Le phénotype [Aa] : n2 individus → 2n2 allèles
Le phénotype [aa] : n3 individus → 2n3 allèles

N = n1+n2+n3
1-Composition phénotypique

f [AA] = n1/N = D
f [Aa] = n2/N = H D+ H+R =1
f [aa] = n3/N = R

2-Composition génotypique
Dans ce cas précis, elle est traduite par les fréquences phénotypiques.

Rq : Dans le cas d’un gène avec dominance absolue, il faut nécessairement se reporter au mode de reproduction.

3- Composition allélique
Elle est traduite par les fréquences alléliques :

p = f(A)= 2n1/2N + n2/2N = D + ½ H p+q =1


q = f(a)= 2n3/2N + n2/2N = R + ½ H

4-Application
Chez l'homme, le groupe sanguin MN est déterminé par un gène à deux allèles codominants M et
N, ce qui permet d'attribuer un génotype à chaque individu échantillonné, puis d'estimer les
fréquences alléliques dans la population. Une étude portant sur 730 aborigènes australiens a
donné les résultats suivants :

Groupes sanguins Nombre


[M] 22
[MN] 216
[N] 492

2
1-Calculer les fréquences phénotypiques et génotypiques

Groupes sanguins Génotypes Nombre


[M] MM D = 22/730 = 0.03
[MN] MN H = 216/730 = 0.30
[N] NN R = 492/730 = 0.67

2-Calculer les fréquences alléliques p et q de deux allèles M et N par deux méthode:

1ère méthode

p = f(A)= 2n1/2N + n2/2N


q = f(a)= 2n3/2N + n2/2N
Application :
p = 22 + (1/2 x 216)/730 = 0,178 pour l'allèle M
q = 492 + (1/2 x 216)/730 = 0,822 pour l'allèle N

2ère méthode
p= D + ½ H
q= R + ½ H

Application :
p = 0.03 + ½ 0.3 = 0,178 pour l'allèle M
q = 0.67 + ½ 0.3 = 0,822 pour l'allèle N

L’une des questions importantes en génétique des populations et de savoir si la fréquence


allélique est constante d’une génération à l’autre.
On cherche autant que possible à définir les populations dans des conditions qui
correspondent à un état d’équilibre.
Une population est considérée en équilibre si au cours des générations successives, sa
composition reste constante, exemple : p0 = p1= p2 = p3 =….= pn.
Cet équilibre peut être modifié par certains facteurs tels que : mutation, sélection,
migration et système de reproduction.

III. La variabilité génétique dans les populations naturelles


Une particularité du monde vivant est la variabilité des phénotypes individuels. A l'intérieur
d'une espèce, il n'existe pas 2 individus ayant exactement les mêmes caractéristiques
phénotypiques: l'individu est unique. Si pour une espèce donnée on peut noter l'absence de
variations pour certains caractères essentiels, il existe toujours de nombreux autres caractères
pour lesquels des variations entre individus sont observées. Certaines de ces variations
s'expriment au niveau phénotypique (morphologie, physiologie, comportement, etc) mais les
autres restent "cachées" et leur mise en évidence nécessite l'utilisation de techniques adaptées
(variabilité des protéines ou des séquences d'ADN).
Les variations du phénotype sont dues pour partie à des facteurs environnementaux
(alimentation, climat, interactions avec les autres espèces, etc) et pour partie à des différences
entre les génotypes individuels, transmissibles à la descendance. Dans la plupart des cas, ces deux
causes de variation interagissent fortement (= interactions génotype-environnement), et il est
difficile de mesurer leur part relative dans la variation phénotypique globale. La mise en évidence
du déterminisme génétique des variations nécessite des études faisant appel soit à des expériences
de croisements, soit à des analyses de généalogie, soit, pour les caractères complexes déterminés
par plusieurs gènes, des comparaisons entre individus apparentés et non apparentés à l'aide de
méthodes statistiques qui sont du domaine de la génétique quantitative.

3
1. Déterminisme des variations : notion de polymorphisme
La génétique des populations s'intéresse principalement à la variabilité d'origine génétique
présente dans les populations et que l'on désigne sous le nom de polymorphisme. Dans sa
définition historique (Ford années 1940), le polymorphisme concernait les caractéristiques
phénotypiques accessibles aux observations de cette époque (couleur, forme, etc). Cette
définition du polymorphisme peut être résumée de la façon suivante :
ll y a polymorphisme si dans une même population coexistent pour un caractère donné plusieurs formes
phénotypiques discontinues, déterminées génétiquement, et dont la plus fréquente ne représente pas plus d'une
certaine fraction de la population totale, fixée à 95 ou 99%. La population est alors qualifiée de polymorphe.
L'utilisation de plus en plus répandue des techniques de biologie moléculaire permettant
d'étudier la variabilité non exprimée au niveau phénotypique (portions non codantes de d'ADN) a
nécessité une définition plus large du polymorphisme qui peut être la suivante :
ll y a polymorphisme si dans une même population une portion codante ou non codante d'ADN présente une
variation de séquence correspondant à plusieurs formes alléliques dont la plus fréquente ne représente pas plus d'une
certaine fraction de la population totale, fixée à 95 ou 99%.
Dans ces deux définitions, le seuil de 1% ou 5% permet de distinguer les gènes polymorphes,
pour lesquels les variations alléliques sont fréquentes, et les gènes pour lesquels les variations
alléliques ont un caractère exceptionnel avec un allèle très majoritaire et une ou plusieurs formes
alléliques rares (inférieure à 1%). On parle dans ce cas de cryptopolymorphisme qui résulte le plus
souvent de mutations désavantageuses qui seront éliminées par la sélection naturelle. La plupart
des maladies génétiques chez l'homme relèvent du cryptopolymorphisme.
Un gène est qualifié de polymorphe lorsque plusieurs allèles sont présents dans une population
avec une fréquence supérieure à 1%. Par opposition, on appelle monomorphes les gènes qui ne
présentent pas de variabilité (un seul allèle présent dans la population).
L'état polymorphe ou monomorphe est une caractéristique d'un gène (ou portion non codante
d'ADN) et d'une population. Ainsi, une même population peut être polymorphe pour un
caractère donné et monomorphe pour un autre caractère. De la même façon, un caractère
monomorphe dans une population peut être polymorphe dans une autre population.
Lorsque la variabilité d'un caractère n'a aucune base génétique, c'est à dire ne fait pas intervenir de
modification de séquence d'ADN, elle est qualifiée de variabilité épigénétique. Cette variabilité
résulte souvent de l'action des facteurs environnementaux sur l'expression phénotypique d'un
caractère (température, alimentation, physico-chimie de l'environnement, etc). Lorsque la
variabilité d'une population présente un déterminisme uniquement épigénétique, on parle de
polyphénisme. Le caractère présente alors une plasticité phénotypique. De telles variations
épigénétiques sont très fréquentes dans les populations animales et végétales.

Dans certains cas, la variabilité phénotypique est due à la variation d'un seul gène =
déterminisme monogénique. Cela ne veut pas dire que le caractère est contrôlé par un seul
gène mais que la variation d'un seul de ces gènes est suffisante pour entraîner une variation
phénotypique. On parle alors de caractères mendeliens. Chez l'homme, environ 5000 caractères
mendeliens sont connus. Ils sont répertoriés dans la base de données OMIN (Online Mendelian
Inheritance in Man) où chaque caractère porte un code par exemple MIN 143100 pour la maladie
de Huntington.
Dans d'autres cas, la variabilité d'un caractère est déterminée par un grand nombre de gènes ayant
chacun plusieurs allèles. On parle de déterminisme polygénique. C'est le cas de tous les
caractères quantitatifs qui font l'objet d'une mesure comme la taille, le poids, etc. L'analyse
génétique de ces caractères relève de la génétique quantitative qui sépare les effets des gènes en
effets additifs A, effets de dominance D, effet d'épistasie ou d'interaction entre gènes I:
G=A+D+I
2. Types du polymorphisme génétique
Le polymorphisme génétique peut se manifester par la variabilité au niveau des produits directe
des gènes c'est-à-dire les protéines. En effet, si une modification touche un codon d’un gène de
structure, cela entraînera une substitution d’acide aminé dans le polypeptide correspondant. Cette
modification peut modifier les propriétés physiques de la protéine (par ex: changement de la
charge nette de la protéine).
4
Au niveau de l’ADN différents types de polymorphismes génétiques sont distingués:
-Le polymorphisme ponctuel : variation à l’échelle du nucléotide. Il concerne 1 à quelques nucléotides :
On distingue les SNP (Single Nucleotide Polymorphism), ou polymorphismes simple nucléotide,
substitution d’une paire de base par une autre paire de base en un site du génome (1 tous les 2000
pb). Le polymorphisme de longueur de fragments de restriction (Restriction Fragment Length
Polymorphism), en général dus à un SNP qui fait apparaître ou disparaître, en un locus du génome,
un site de reconnaissance spécifique d’une endonucléase.
- Le polymorphisme Indel (Insertions-Délétions), ou polymorphismes d’insertion-délétion d’une
séquence d’ADN en un site du génome, formant le plus souvent un polymorphisme di-allélique,
repérable par étude de la longueur du fragment d’ADN amplifié par PCR, à partir de deux
amorces flanquant le site du marqueur.
Le polymorphisme d’insertion : Insertions de séquences mobiles (transposons) ou virales
Séquences d'ADN répétitif dispersé possèdent une structure de transposons, éléments d'ADN
instables, capables de migrer vers différentes régions du génome par rétrotransposition : Leur
transcrits ARN est convertis dans la cellule en ADN complémentaire et réinsérable au sein de
l'ADN génomique. Les deux principaux groupes de telles séquences présents chez les
mammifères constituent :
→ Les LINEs pour Long INterspersed Elements: sont des longs éléments nucléaires intercalés. Leur
taille est de quelques kilobases ou plus précisément 6 000 à 7 000 pb. The human genome, for
example, contains about 500,000 LINEs, which is roughly 17% of the genome.
→ Les SINEs pour Short INterspersed Elements : Sont des petits éléments nucléaires intercalés
(SINE) : leur taille varie entre 130 et 500 pb, les plus abondantes chez l'homme sont les
séquences ALU (un court fragment d'ADN de type SINE caractérisé par la présence d'un site de
restriction de l'endonucléase de restriction Alu I)

-Le polymorphisme de taille : ou polymorphisme de répétition : variation du nombre de motifs


répétés
→ADN microsatellite ou STR pour "Short Tandem Repeats", ou polymorphismes de
courtes séquences de 1 à 6 nucléotides répétées en tandem.
Par exemple :
-ATATATATATATATAT soit (AT)n n variable entre individus
-CAGACAGACAGACA soit (CAGA)n

→ ADN minisatellite ou VNTR pour "Variable Number Tandem Repeats". Les


séquences répétées sont des répétions de 10 à 100 nucléotides. On regroupe parfois ces méthodes
sous le nom « Multiple Loci VNTR Analysis »

-Le polymorphisme chromosomique : Des mutations peuvent survenir à une autre échelle au sein du
génome et affecter le nombre ou la structure des chromosomes. Les modifications dans la
structure des chromosomes correspondent à des translocations de fragments chromosomiques,
des inversions, des fusions centriques, des délétions ou des duplications. Les changements du
nombre de chromosomes sont de deux types: l'aneuploïdie (perte ou ajout d'un ou plusieurs
chromosomes (par exemple la trisomie = 2N+1) et la polyploïdie : changement du nombre
d'exemplaire du lot haploïde (passage diploïde = 2N à tétraploïde= 4N)

3. Niveaux de perception du polymorphisme


Les niveaux de perception du polymorphisme sont nombreux et historiquement on distingue :
→Jusqu’aux années 60 : Polymorphisme morphologique : taille, forme, couleur etc. La variabilité
génétique de la couleur de certaines espèces, appelée polychromatisme, est certainement l'un des
polymorphismes qui a été le plus étudié.
Exemple1: la couleur et l'ornementation de la coquille de l'escargot du genre Cepaea (des escargots
à coquille rose, jaune ou brune, et des escargots sans bande et avec bandes dont le nombre varie
entre 1 et 5)

5
Exemple2: le papillon Biston betularia. Ces papillons de nuit sont normalement de couleur claire,
légèrement tachetée, ce qui les rend mimétiques le jour lorsqu’ils se reposent sur le tronc des
arbres. Dans certaines régions où le tronc des arbres est plus sombre, les populations sont
caractérisées par une forte fréquence de papillons sombres presque noirs, appelés "melanica", due
à un allèle D, dominant sur l'allèle d.
→Années 60 : Polymorphisme des protéines ou polymorphisme électrophoréitique: découverte
des allozenzymes : les différentes formes d’une enzyme ou isoenzymes peuvent être séparées par
électrophorèse.
→Années 70 : enzyme de restriction→ outils moléculaires
→Années 80 : PCR et RFLP→ outils moléculaires
→Les RAPD (Random Amplified Polymorphism DNA) (1990): Cette technique consiste à réaliser
une amplification PCR avec des amorces d'environ 10 pb définies de façon aléatoire.
→Microsatellites : courtes séquences répétées en tandem VNTR et STR (1992).
→Les AFLP (Amplified Fragment Length Polymorphism) (1995) : Les microsatellites sont souvent
multi-alléliques. Leur détection est obtenue par PCR du locus contenant la séquence répétée
suivie d’une électrophorèse du produit de PCR qui permet de distinguer les allèles en fonction de
leur taille.
→Le Séquençage : caractérisation des différentes paires de bases.
Le séquençage complet de certaines portions du génome fournit le maximum de renseignements
sur l'étendue de la variabilité interindividuelle.

4. Mesure de la diversité génétique


Pour quantifier la variabilité d'une population étudiée sur plusieurs gènes, différents paramètres
peuvent être calculés.
a) Fréquences alléliques et fréquences génotypiques
Lorsqu'une population est polymorphe pour un caractère donné, il est possible de calculer la
fréquence des phénotypes observés (voir partie Description génétique d’une population)
b) Degré de polymorphisme ou Taux de polymorphisme (P)
La proportion de locus polymorphes, encore appelée taux de polymorphisme ou plus simplement
polymorphisme (P), rend compte de la proportion des gènes polymorphes parmi l'ensemble des
gènes étudiés.

P = Nbre de gènes polymorphes/Nbre total de gènes étudiés

Ce paramètre présente cependant l'inconvénient de ne prendre en compte le nombre d'allèles


rencontrés à chacun des loci polymorphes, ni leurs fréquences. Il est évident qu'un locus
possédant 10 allèles de fréquences voisines apporte plus de variation génétique à la population
qu'un locus n'ayant que deux allèles dont un faiblement représenté.
Par exemple
Si 30 loci enzymatiques ont été étudiés par la méthode d'électrophorèse avec 12 loci
monomorphes et 18 polymorphes, le taux de polymorphisme P est 18/30 = 0,6.

c) Taux d’hétérozygotie (H)


C'est la moyenne des fréquences des hétérozygotes observées à chacun des locus étudiés.

Ho = 1/N Σ Hi,
N étant le nombre total de loci étudiés qu'ils soient monomorphes ou polymorphes Hi
hétérozygotie au locus i.

Le taux d'hétérozygotie fournit une bonne estimation de la variabilité génétique de la


population, à condition toutefois que les individus de cette population se reproduisent au hasard.
Des modes de reproduction différents (homogamie, consanguinité, autogamie),
conduisent à des situations où Ho ne donne plus une bonne estimation de la variabilité génétique.
6
Les modes de reproduction n'étant pas toujours connus, on calcule alors un autre
paramètre qui est l'hétérozygotie théorique attendue (Ht).
Pour un locus A à k allèles A1, A2, ...Ak de fréquences f1 , f2 , .. ,fk, l'hétérozygotie attendue est
la suivante :
HtA= 1 - (f12+f22+ .. +fk2) = 1- Σf2
C'est est une estimation de la fréquence des hétérozygotes si les allèles sont associés au hasard
pour former les génotypes.
L'hétérozygotie théorique globale est la moyenne des hétérozygoties attendues à chacun des
loci étudiés:
Ht = 1/N Σ Hti
Avec :
N étant le nombre total de loci étudiés qu'ils soient monomorphes ou polymorphes
Hti hétérozygotie théorique au locus i

Il est alors possible de comparer la variabilité génétique des populations qui présentent des modes
de reproduction différents.

d) Diversité allélique ou Nombre moyen d’allèles par locus (A)


Le nombre moyen d'allèles par locus (A), appelé également taux d’allélisme ou richesse allélique,
est défini pour ni allèles au locus i et pour L loci comme :

A= nbre total d'allèles / nbre de loci

Exemple: pour 3 loci numéroté 1, 2 et 3 ayant respectivement 2, 3 et 2 allèles,


A = (2 + 3 + 2)/3 = 2,33
Pour prendre en compte la fréquence de ces allèles, on peut calculer le nombre d'allèles
efficaces Ae.
Pour un locus A à k allèles A1, A2, ...Ak de fréquences f1 , f2 , .. ,fk, le nombre d'allèles efficaces
est:
Ae= 1 /(f12+f22+ .. +fk2) = 1/Σf2
On calcule alors la moyenne du nombre d'allèles efficaces par locus.

Vous aimerez peut-être aussi