Doc 04

Télécharger au format doc, pdf ou txt
Télécharger au format doc, pdf ou txt
Vous êtes sur la page 1sur 38

LE MODELE DE HARDY-WEINBERG

L'ensemble des forces qui s'exercent sur une population détermine sa constitution génétique et tend
à la maintenir ou à la modifier. Les fréquences des génotypes et des allèles sont liées par des relations qu'il est
possible de formaliser par un modèle mathématique plus ou moins complexe.

Nous analyserons, au cours des chapitres suivants, quelques modèles élémentaires concernant les
principales forces évolutives connues, pour en préciser l'impact sur le devenir des populations. Dans le présent
chapitre nous définirons la constitution génétique d'une population, puis nous étudierons son devenir dans le
cadre du modèle de Hardy-Weinberg. Appréhendé en 1903 par Castle, ce modèle (ou loi) a été indépendament
établie par le mathématicien G.Hardy (1908, Science 28:41) et par le médecin W. Weinberg.

4.1 CONSTITUTION GENETIQUE DES POPULATIONS

4.1.1 DÉFINITIONS

Pour définir la constitution génétique d'une population plusieurs niveaux, phénotypique,


génotypique et génique sont utilisés. Ils sont décrits par une loi de probabilité. Ainsi pour une variable donnée
(e.g. le caractère: couleur des yeux) on précisera les différents états possibles (bleu, vert, marron ...) et les
probabilités avec lesquelles ces états se rencontrent dans la population étudiée (0,10 ; 0,20 ; 0,60 ...). Ce
premier descripteur est la constitution phénotypique de la population.

De manière similaire la constitution génotypique précise, pour le caractère considéré, les différents
génotypes possibles et leurs probabilités. La relation génotype-phénotype nécessite généralement une analyse
génétique préalable pour établir les effets éventuels de dominance ou d'épistasie.

Enfin, la constitution allélique fournit, pour un locus considéré, les allèles présents dans la
population et leurs probabilités.

Dans la pratique la connaissance de ces différentes constitutions n'est pas toujours aisée. Elle
dépend du caractère considéré et de son déterminisme génétique. Pour les caractères ayant un déterminisme
mendélien simple, comme les systèmes enzymatiques polymorphes et les PLFR, la constitution génétique
s'obtient facilement à partir des échantillons étudiés. Les caractères à déterminisme polyfactoriel plus
complexe (caractères dits quantitatifs comme la taille, le poids,...) font l'objet de traitements particuliers,
développés dans une branche de la génétique appelée Génétique Quantitative. La présentation globale de ce
domaine dépasse le cadre du présent texte, mais les lecteurs intéressés pourront consulter les ouvrages
spécialisés cités en référence (Falconer,1983, Bulmer, 1985, Olivier 1985, Minvielle,1990).
IV-2

Afin de déterminer les différentes constitutions précédemment définies, les techniques classiques
de l'estimation statistique sont utilisées. On obtient ainsi, à partir d'un échantillon représentatif de la
population, les fréquences relatives des différents phénotypes, génotypes et allèles.

Le terme fréquence sera ainsi entendu au sens de fréquence relative dans le reste du texte, sauf
indication contraire. Les termes de locus, gènes et allèles n'étant pas toujours utilisés de manière cohérente,
précisons que le terme locus désignera par la suite un emplacement sur le chromosome et le terme allèle l'un
des états alternatifs d'un gène occupant cet emplacement. Ainsi pour un caractère à déterminisme
monogénique présentant plusieurs allèles, il convient de parler de fréquences alléliques, plutôt que de
fréquences géniques.

4.1.2 EXEMPLES D'ESTIMATION DE CONSTITUTIONS GÉNÉTIQUES

4.1.2.1 Cas de gènes autosomiques

Soit une population de N individus diploïdes à reproduction sexuée biparentale, étudiée pour un
caractère à déterminisme monogénique. On y observe trois classes génotypiques d'effectifs respectifs n 1, n2,
n3, avec n1 + n2 + n3 = N. Le déterminisme génétique étant connu, un couple d'allèles autosomiques A 1, A2
codominants, la constitution génotypique de la population correspond à sa constitution phénotypique. Les
fréquences génotypiques sont alors exactement définies par les rapports :

freq (A1A1) = f1 = D = n1/N


freq (A1A2) = f2 = H = n2/N
freq (A2A2) = f3 = R = n3/N

avec fi = 1.
i

La constitution allélique de cette population se déduit de la précédente en estimant les fréquences


respectives des allèles A1 et A2.

DEFINITION : La fréquence (relative) d'un allèle Ai est égale au rapport du nombre d'allèles A i
au nombre total d'allèles au locus considéré.

Corollairement, elle est égale à la fréquence des homozygotes pour cet allèle, augmentée de la
moitié de la fréquence des hétérozygotes.

On établit les fréquences alléliques en considérant chaque individu comme une seule cellule (le
zygote initial). Le nombre total d'allèles A 1 et A2 dans une population de N individus est donc de 2N, et la
fréquence de l'allèle A1 est estimée par simple comptage :
IV-3

x1 = (2n1 + n2)/2N = D + 1/2 H,

et celle de l'allèle A2 par :

x2 = (2n3 + n2)/2N = R + 1/2 H.

On vérifie que la somme des fréquences est bien égale à 1. La distribution de ces estimations suit
une loi binomiale dont la variance est égale à Var(x 1) = Var(x2) = x1x2/2N.

Exemple : Chez l'homme, l'examen des groupes sanguins fournit de nombreuses statistiques très
utilisées en génétique des populations humaines.

Sur un échantillon de 1279 donneurs anglais, on a observé pour le groupe sanguin MN les valeurs
suivantes :

Groupe [M] [MN] [N] 

Effectif 363 634 282 1279

Fréquence 0,2838 0,4957 0,2205 1


phénotypique

Il existe deux allèles codominants M et N qui déterminent chacun la présence de l'antigène


correspondant sur les hématies. Aux trois phénotypes [M], [MN], [N], correspondent donc trois génotypes
MM, MN et NN. Les fréquences alléliques dans cet échantillon sont donc :

xM = 0,2838 + (0,4957/2) = 0,532

xN = 0,2205 + (0,4957/2) = 0,468

et Var(xM) = Var(xN) = 1. 10-4.

On remarquera que lorsqu'il existe une relation de dominance entre allèles, e.g. A dominant sur a,
seules les fréquences phénotypiques peuvent être estimées. La connaissance des fréquences alléliques nécessite
une information supplémentaire. Cette information peut provenir soit d'une expérimentation permettant de
distinguer les homozygotes dominants des hétérozygotes, soit de la connaissance de relations mathématiques
particulières entre fréquences phénotypiques, génotypiques et alléliques.

4.1.2.2 Cas de gènes liés au sexe (ou de gènes d'un système haplo-diploïde) :
IV-4

Soit A1 et A2 des allèles situés sur l'hétérochromosome commun aux deux sexes. Dans une
population où l'on dénombre N 1 individus de sexe homogamétique et N 2 de sexe hétérogamétique, le nombre
de gènes concernés est de 2N 1 + N2. Notons n1, n2, n3, les effectifs des génotypes A 1A1, A1A2, A2A2 chez
les femelles, et m 1 et m2 ceux des génotypes A1 et A2 chez les mâles. En considérant chaque groupe sexuel
comme un échantillon indépendant, on peut estimer la fréquence de l'allèle A 1 pour chacun des sexes et pour
l'ensemble de la population. Ces estimations et leurs variances sont :

x1f = (2n1 + n2)/2N1

Var(x1f) = x1f(1-x1f)/2N1 ,

x1m = m1/ N2

Var(x1m) = x1m(1-x1m)/N2 , et

x1 = (2n1 + n2 + m1)/(2N1 + N2)

Var(x1) = x1(1-x1)/(2N1 + N2).

Exemple : Chez la Drosophile, la forme de l'oeil, ovoïde chez les individus sauvages, peut être
modifiée par le gène Bar: B. Ce gène, situé sur le chromosome X, détermine un phénotype "oeil en forme de
barre" chez les femelles homozygotes BB, et chez les mâles hémizygotes B. Chez les femelles hétérozygotes
BB+ les yeux sont réniformes. Dans ce sytème les cinq génotypes peuvent donc être distingués. Soit un
échantillon portant sur l'examen de 716 femelles et 695 mâles.

_____________________________________________
femelles mâles
__________________________________________________

phénotypes [+] [1/2 B] [B] [+] [B]

génotypes B+/B+ B+/B B/B B+ / 7 B/7

effectifs 282 361 73 457 238

7 représente le chromosome Y qui, chez la Drosophile, ne porte que très peu de gènes communs avec
le chromosome X.

Les fréquences alléliques de B chez les femelles et chez les mâles peuvent être estimées par :

x2f = [361 + (2 x 73)]/(2 x 716) = 0,354


IV-5

x2m = 238/695 = 0,342 .

Les variances de ces estimations sont très proches : Var(x 2f) = 3,2. 10-4 et Var(x2m) = 1,6. 10-4, et en
fait non statistiquement différentes. Une meilleure estimation est obtenue en calculant la fréquence allélique
sur l'ensemble de l'échantillon :

x2 = [361 + (2 x 73) + 238]/[(2 x 716) + 695] = 0,350,

avec Var(x2) = 1,0. 10-4.


Dans le cas de dominance entre allèles, les fréquences alléliques pourront être estimées seulement
chez le sexe hétérogamétique, une information supplémentaire étant nécessaire pour calculer les fréquences
alléliques chez le sexe homogamétique.

4.2 DEFINITION DU MODELE DE HARDY-WEINBERG

Le modèle de Hardy-Weinberg repose sur plusieurs hypothèses que nous allons décrire en examinant
un cycle de reproduction partant des gamètes d'une génération t pour arriver aux gamètes de la génération t+1
(fig.4.1). Nous supposons ici que les générations ne sont pas chevauchantes, hypothèse qui facilite l'exposé,
mais peut être levée facilement. Considérons un locus autosomique pouvant être occupé par l'un ou l'autre des
deux allèles A1 ou A2 (locus diallélique) avec les probabilités x 1 et x2, et établissons la constitution génétique
de la population. Les génotypes A1A1 et A2A2 sont appelés homozygotes, car formés chacun de deux allèles
possédant une information similaire, codant pour deux produits ayant la même action. On les définit également
comme allèles isoactifs. En toute rigueur selon cette définition, deux allèles isoactifs peuvent posséder
quelques différences de séquences, notamment au niveau de mutations silencieuses (cf.4.5.4.2.: allèle Adh S et
AdhF de la Drosophile).

4.2.1 L'HYPOTHÈSE PANMICTIQUE

De la rencontre des gamètes de la génération t seront issus les zygotes de la génération t+1. Si la
rencontre de ces gamètes se fait au hasard, la probabilité de réalisation d'un zygote de génotype donné est
égale au produit des probabilités du type allélique (A 1 ou A2) du gamète mâle et du gamète femelle qui,
ensemble, réalisent ce génotype. S'il existe plusieurs possibilités de réalisation de ce génotype, on fera la
somme des probabilités de chacune d'entre elles, les diverses possibilités de réalisation d'un même génotype
étant évidemment exclusives.

Pour que la rencontre des gamètes se fasse au hasard, il faut :


1) que les gamètes émis s'unissent indépendamment de leur génotype,
IV-6

2) et, si elle a lieu, que l'union des individus deux sexes se fasse au hasard, c'est-à-dire qu'aucun choix, ni en
fonction du phénotype, ni en fonction du génotype, ne préside à la formation des couples.

Lorsque la rencontre des gamètes se fait au hasard, on dit qu'il y a pangamie; lorsque la rencontre des
individus se fait au hasard, ont dit qu'il y a panmixie. Implicitement ou explicitement, la plupart des auteurs
incluent la première hypothèse dans la seconde, formant alors une hypothèse générale que l'on nomme
"hypothèse panmictique". En l'abscence d'indication contraire, c'est à cette dernière hypothèse que nous nous
réfèrerons.

4.2.2 CONSTITUTION GÉNOTYPIQUE D'UNE POPULATION

Dans l'hypothèse panmictique, chaque nouveau zygote formé résulte de deux tirages au sort
indépendants, l'un dans l'urne des ovules, l'autre dans l'urne des spermatozoïdes. Ces urnes sont respectivement
composées de l'ensemble des ovules matures fournis par les femelles de la population au moment du tirage et
de l'ensemble des spermatozoïdes matures fournis par les mâles de la population au moment du tirage. Par
hypothèse, ces deux urnes sont d'effectif infini et possèdent les mêmes fréquences alléliques. Calculons les
probabilités des différents zygotes possibles.

- Génotype A1A11.

Par définition, x1 est la probabilité de tirer A 1 de l'urne des ovule et x 1 celle de tirer également A 1 de
l'urne des spermatozoïdes. La probabilité de réaliser le génotype A 1A1 est donc x12 (tirages indépendants).

- Génotype A2A2.

Un raisonnement similaire conduit à la probabilité x 22.

- Génotype A1A2.

Avec x1, probabilité de tirer A 1 de l'urne des ovules et x 2 celle de tirer A2 de l'urne des
spermatozoïdes, la probabilité de réaliser le génotype A 1A2 est x1x2. Mais on peut obtenir un zygote A1A2
d'une autre manière, en tirant A 1 de l'urne des spermatozoïdes et A 2 de l'urne des ovules, soit également x 1x2.
Ces deux possibilité étant exclusives, la probabilité totale devient donc 2 x 1x2.

Les probabilités de chaque nouveau zygote sont donc :

A1A1 = x12
A1A2 = 2 x1x2
A2A2 = x22.
IV-7

On peut parvenir au même résultat par la méthode de l'échiquier des croisements. Il suffit de
remarquer que la constitution génotypique est déterminée par la constitution allélique, et on obtient le tableau
suivant :
_______________________________________
Urne des SPERMATOZOIDES
_______________________________________
A1 (x1) A2 (x2)
_______________________________________
Urne des
O
V A1 (x1) A1A1 (x12) A1A2 (x1x2)
U
L
E A2 (x2) A2A1 (x2x1) A2A2 (x22)
S
________________________________________________

On retrouve la relation :

(x1 + x2)2 = x12 + 2x1x2 + x22 = 1,

et, en se souvenant que x1 + x2 = 1, on vérifie que la somme des différentes probabilités génotypiques est
bien égale à 1. On remarquera que ces probabilités sont indépendantes du sexe des individus qui seront formés.
Dans la population il y a donc la même constitution allélique dans les deux sexes.

Ces probabilités seront identiques aux fréquences génotypiques des adultes reproducteurs de la
population, à condition de formuler de nouvelles hypothèses:

- un effectif infini de la population. Sous cette condition les fréquences génotypiques des zygotes sont
exactement égales à leur probabilité de réalisation et ne sont pas aléatoirement modifiées jusqu'à l'âge de la
reproduction.

- une absence de migration, pour que l'ensemble des adultes issus des zygotes formés, et eux seulement,
participent à la reproduction,

- une absence de sélection, afin que la probabilité de survie de chaque gamète jusqu'à la fécondation, puis de
chaque zygote jusqu'à l'âge de la reproduction soit indépendante de son génotype.
IV-8

Si ces conditions sont réunies, la constitution allélique de la population des adultes reproducteurs est la
même que celle des gamètes dont elle provient. En effet, si x 1' est la fréquence de l'allèle A 1 dans la
population des adultes, on a bien :

x1' = D + 1/2 H

= x12 + 1/2 (2 x1x2) = x1 (x1 + x2) = x1.

Enfin, si ces fréquences alléliques ne sont pas modifiées au cours de la reproduction, elles seront
identiques à celles des gamètes A 1 et A2 qui composeront les urnes des ovules et des spermatozoïdes de la
génération t+1. Il convient pour cela de supposer que la population ne subit pas de mutations, que la méiose se
déroule sans biais chez les reproducteurs et que ceux-ci ont une même fécondité quel que soit leur génotype.

Si toutes ces hypothèses sont satisfaites, les fréquences alléliques des gamètes de la génération t+1
restent égales à celles de la génération t. La constitution allélique ne varie pas au cours des générations.

De même, les fréquences des différents génotypes seront toujours données par le développement du
binôme:

(x1 + x2)2 = x12 + 2x1x2 + x22.

Elles ne seront donc pas modifiées et la constitution génotypique restera identique au cours des
générations. La population est dite "à l'équilibre de Hardy-Weinberg", pour le locus considéré.

4.2.3 EQUILIBRE DE HARDY-WEINBERG

Les relations de Hardy-Weinberg entre constitutions allélique et génotypique sont présentées sur la
figure 4.2 qui donne les graphes des fréquences génotypiques en fonction de la fréquences allélique A 1.
Ainsi pour une fréquence allélique A 1 de 0,7, (A2 = 0,3) une population à l'équilibre de Hardy-
Weinberg aura la constitution génotypique suivante :

A1A1 = 0,49 A1A2 = 0,42 A2A2 = 0,09.

Il convient de remarquer que pour une fréquence allélique donnée (A 1 = 0,7) une autre population
pourrait présenter des fréquences génotypiques différentes :

A1A1 = 0,60 A1A2 = 0,20 A2A2 = 0,20.


IV-9

Cette population ne serait pas à l'équilibre de Hardy-Weinberg. Cependant, si à une génération t cette
population était soumise à toutes les conditions de la loi de Hardy-Weinberg, il suffirait d' une seule génération
de "brassage" génétique pour que la constitution génétique définie par la loi de Hardy-Weinberg soit atteinte.

Ceci permet de préciser la nature de l'état d'équilibre de Hardy-Weinberg qui est un équilibre
indifférent. Soit une variation fortuite intervenant dans une population jusque là en équilibre de Hardy-
Weinberg, et qui en modifie les fréquences alléliques (e.g. A 1 = 0,6 au lieu de 0,7). Au retour des conditions
d'application du modèle, la population retrouvera des proportions de Hardy-Weinberg, mais différentes des
précédentes, soit :

A1 A1 = 0,36 A1 A2 = 0,48 A2 A2 = 0,16.


Le modèle de Hardy-Weinberg correspond ainsi à une loi d'inertie qui définit un état d'équilibre (indifférent),
que l'on peut comparer à celui d'une bille placée sur un plan horizontal et qui reste à l'endroit où on l'a posée.
Cette situation est différente de celle d'une population dans laquelle joueraient des facteurs évolutifs, qui
tendraient à la faire converger vers un état d'équilibre précis. Il s'agirait alors d'un état d'équibre dynamique,
comparable à celui d'une bille placée sur un plan incurvé et qui ne peut occuper, de manière stable, que la
position la plus basse.

4.2.4 CAS DES FRÉQUENCES ALLÉLIQUES DIFFÉRENTES DANS LES DEUX SEXES.

Nous avons considéré jusqu'à présent que les fréquences alléliques étaient les mêmes dans les deux
sexes. Examinons maintenant l'évolution des constitutions génotypiques de la population lorsque les
fréquences alléliques sont différentes dans les deux sexes.

Soit toujours un couple d'allèles autosomiques A 1 et A2 de fréquence x1f et x2f chez les femelles
et x1m, x2m chez les mâles. Comme précédemment, les individus résultent de l'union au hasard des gamètes,
et les probabilités des différents génotypes sont donc :

A1A1 A1A2 A2A2


x1fx1m x1fx2m + x1mx2f x2fx2m

La fréquence allélique de A1 dans l'ensemble de la population s'établit ainsi :


freq. (A1) = x1f x1m + 1/2 (x1f x2m + x1m x2f)

= 1/2 (x1f x1m + x1f x2m) + 1/2 (x1f x1m + x1m x2f)

= 1/2 (x1f + x1m)

La fréquence allélique à la génération t+1 sera égale à la moyenne des fréquences dans chacun des
sexes à la génération t. Le locus considéré étant autosomique, cette fréquence sera la même parmi les
IV-10

descendants mâles et femelles. Dans ce cas, il suffit d'une génération pour égaliser les fréquences alléliques
entre les sexes. Il faudra ensuite une seconde génération pour atteindre les fréquences génotypiques d'équilibre
de la loi de Hardy-Weinberg.

4.3 GENERALISATION DE LA RELATION DE HARDY-WEINBERG

4.3.1 LE MULTIALLÉLISME DANS LE CAS D'UN LOCUS AUTOSOMIQUE

4.3.1.1 Le cas de trois allèles

Dans une population soumise aux hypothèses de Hardy-Weinberg, considérons trois allèles A 1,
A2, A3 de fréquences respectives x 1, x2, x3, identiques dans les deux sexes. Les six fréquences génotypiques
des zygotes (et des adultes reproducteurs) sont obtenues par l'échiquier des rencontres gamétiques qui conduit
à la distribution suivante :

__________________________________________________________
gamètes o A1 A2 A3
(x1) (x2) (x3)
__________________________________________________________
gamètes o

A1 (x1) A1A1 (x12) A1A2 (x1 x2) A1A3 (x1 x3)

A2 (x2) A1A2 (x1 x2) A2A2 (x22) A2A3 (x2 x3)

A3 (x3) A1A3 (x1 x3) A2A3 (x2 x3) A3A3 (x22)

__________________________________________________________

Ces fréquences génotypiques des adultes reproducteurs sont egalement obtenues par le
développement du trinôme :

(x1 + x2 + x3)2, soit :


IV-11

A1A1 A2A2 A3A3 A1A2 A1A3 A2A3

x12 x 22 x 32 2x1x2 2x1x3 2x2x3

Ces fréquences sont celles de l'état d'équilibre. On le vérifie en calculant la fréquence de l'allèle
A1 dans l'urne gamétique de la génération suivante

Fréq. A1(t+1) = x 12 + x 1x2 + x 1 x3

= x1 (x1 + x2 + x3) = x1

Il en est de même pour A2 et A3, les fréquences ne changent pas au cours des générations. Comme
dans le cas du diallélisme, si la population initiale n'est pas en équilibre, celui-ci sera atteint dès la première
génération.

4.3.1.2 Généralisation pour k allèles

S'il existe k allèles au locus considéré, il y aura k types d'homozygotes différents. D'autre part,
chaque allèle peut être associé aux (k-1) autres allèles. Pour les k allèles, il y a donc k (k-1) arrangements
possibles. Cependant les arrangements symétriques de type A iAj et AjAi correspondant au même génotype, le
nombre de types d'hétérozygotes sera fourni par le nombre de combinaisons, soit k (k - 1)/2. C'est évidemment
le nombre de combinaisons de k éléments pris 2 à 2.

Le nombre total de génotypes différents est donc :

k + k(k - 1)/2 = k(k + 1)/2

Si on note xi la fréquence de l'allèle a i, on aura évidemment :

i=k
 xi = 1
i=1

Les fréquences d'équilibre des génotypes dans la population sont alors pour chaque type :
AiAi = xi2 Aij = 2 xi xj

La fréquence totale des génotypes homozygotes sera :


 xi 2
IV-12

et celle des hétérozygotes:


 xi xj = 2  xi xj = 1-  xi2

i¹j i<j i

Dans la pratique, on peut analyser un échantillon d'une population et rechercher, pour chaque locus
analysé, le nombre d'individus hétérozygotes. On obtient ainsi une estimation de l'hétérozygotie observée au
locus considéré. Cependant cette hétérozygotie observée ne préjuge en rien de la constitution génotypique de
la population qui peut, ou non, être en équilibre de Hardy-Weinberg. Il en résulte parfois une difficulté pour
comparer différentes populations. Cette difficulté peut être surmontée en calculant l' hétérozygotie attendue, en
supposant la population à l'équilibre de Hardy-Weinberg pour le locus considéré. Ainsi pour un locus
possédant quatre allèles de fréquences respectives : 0,7, 0,2, 0,05 et 0,05, l'hétérozygotie attendue sera :

Ha = 1 - ( 0,72 + 0,22 + 0,052 + 0,052) = 0,465.

REMARQUE : si nous considérons les k allèles comme un système de 2 allèles seulement ;


A1 et
(A2 ... Ai ... Ak) => (A),

la fréquence de A1 étant X1 et celle de (A) étant X 2, c'est-à-dire la somme des (k-1) autres
fréquences, on obtient :
X 12 2 X1 X2 X22
A1 A1 A1 (A) (A)(A)
Il convient cependant de prendre garde à ce type de simplification qui peut conduire à une sous-
estimation de la fréquence réelle des hétérozygotes. En reprenant les valeur de l'exemple précédent, le systéme
réduit au deux valeurs 0,7 et 0,3 ne révèlerait plus qu'une hétérozgotie de 0,42, au lieu de 0,465. En effet,
parmi les individus AA se trouvent des homozygotes (e.g. A 2A2) et des hétérézygotes (e.g. A 2A3). Si l'on
souhaite obtenir une estimation correcte il convient donc de détecter tous les allèles. On comprend ainsi
l'intérêt de techniques affinées dans les recherches sur le polymorphisme permettant de mettre en évidence des
allèles "cachés" (e.g. technique de dénaturation thermique, pour distinguer les allozymes migrant à une même
distance sur un gel, mais codées par des allèles de thermosensibilité différente).

On notera également que dans une population à l'équilibre de Hardy-Weinberg, la fréquence des
hétérozygotes pour un système ne comportant que deux allèles ne peut dépasser 0,5. Quand x 1 varie de 0 à 1,
2x1x2 passe par un maximum égale à 0,5 pour x 1=x2 (fig.4.2). Dans le cas du multiallélisme, la fréquence
totale des hétérozygotes peut dépasser 0,5. Avec 3 allèles, la fréquence des hétérozygotes est :

2 (x1x2 + x1x3 + x2x3) = Ha.


IV-13

On démontre que Ha est maximal pour x1 = x2 = x3 = 1/3 ; la fréquence totale des hétérozygotes
étant alors de 2/3. Ce résultat se généralise avec k allèles et une valeur de H a maximale de (k-1)/k, si x i = 1/k
pout tout i.

Les cas de multiallélisme sont fréquents dans les populations naturelles. Ils sont bien connus pour
les systèmes des groupes sanguins (e.g. système ABO avec les allèles I A, IB, iO...), des groupes tissulaires (eg.
système HLA) et des polymorphismes enzymatiques et nucléiques.

4.3.2 CAS D'UN LOCUS SITUÉ SUR UN HÉTÉROCHROMOSOME


(ET GÈNES D'UN SYSTEME HAPLO-DIPLOÏDE)

Lorsqu'un gène est situé sur un hétérochromosome, le sexe homogamétique possède deux locus et
le sexe hétérogamétique un seul.
Pour l'exposé nous supposerons que dans l'espèce étudiée les mâles sont de type XY ou XO et les
femelles XX. Les fréquences alléliques seront calculées indépendamment dans chacun des sexes; la somme
des fréquences pour chaque sexe sera alors égale à l'unité. Si les deux sexes sont en nombre égal dans la
population, 2/3 des allèles liés au sexe seront portés par le sexe homogamétique et 1/3 par l'autre sexe. Pour un
taux sexuel différent, il suffit de pondérer les proportions par les effectifs de chaque sexe.

4.3.2.1 Constitutions génétiques à l'état d'équilibre

Considérons deux allèles A 1 et A2 d'un gène porté par l'X. Lorsque les fréquences x 1 et x2 des
allèles A1 et A2 sont les mêmes pour les deux sexes (x 1m = x1f = x1), x1 et x2 sont aussi les probabilités des
deux types de chromosomes X (X(A1) et X(A2)) dans les spermatozoïdes et dans les ovules.

Les probabilités des génotypes des femelles s'obtiennent à partir de deux tirages au sort indépendants,
et celles des génotypes mâles à partir d'un seul tirage. Sous les hypothèses de Hardy-Weinberg, le passage d'une
génération à la suivante sera déduit de l'échiquier des rencontres gamétiques.
______________________________________________________
Spermatozoïdes X(A1) X(A2) Y
x1 x2
______________________________________________________
Ovules
A1A1 A1A2 A1Y
X(A1) x1
x12 x1x2 x1

A1A2 A2A2 A2Y


X(A2) x2
x1x2 x22 x2
______________________________________________________
1/2 [f] 1/2 [m ]
IV-14

Nous avons donc pour les adultes reproducteurs les constitutions génotypiques suivantes :

femelles
A1 A1 A1 A2 A2 A2
x12 2 x 1 x2 x 22

mâles
A1 A2
x1 x2

La fréquence de l'allèle A1 est égale à x1 dans chaque sexe, elle restera inchangée dans les deux
sexes après une génération en reproduction panmictique. Le même raisonnement est vrai quel que soit le
numéro d'ordre de la génération. Nous sommes en présence d'un état d'équilibre.

4.3.2.2 L'atteinte de l'état d'équilibre

Même si la fréquence allélique n'est pas identique dans les deux sexes, il est évident que, sous les
hypothèses de la loi de Hardy-Weinberg, la fréquence allélique pour l'ensemble de la population ne variera pas
puisqu'aucun facteur évolutif n'agira. Par contre, nous allons montrer que la distribution des fréquences
alléliques, dans chaque sexe, varie en oscillant, tout en se rapprochant de la position d'équilibre.

A chaque génération, chaque mâle reçoit son chromosome X d'une femelle de la génération
précédente, tandis que les deux chromosomes X d'une femelle proviennent d'un mâle et d'une femelle de la
génération précédente. Les relations exprimant le passage d'une génération à la suivante sont :

x1m(t) = x1f(t-1)

x1f(t) = 1/2 x1m(t-1) + 1/2 x1f(t-1) [4.1]

On peut vérifier que la fréquence de A 1 dans l'ensemble de la population ne varie pas et reste
égale à celle de la génération de départ. Soit dans une population de taux sexuel équilibré :
x 1(t) = 1/3 x1m(t) + 2/3 x1f(t)

= 1/3 x1m(t-1) + 2/3 x1f(t-1) = x 1(t-1) = x 1

avec

x 1 = 1/3 x1m(0) + 2/3 x1f(0).

On déduit alors la relation :

x1m(t-1) = 3 x 1 - 2 x1f(t-1)
IV-15

que l'on porte dans l'équation [4.1], pour obtenir l'équation de récurrence de la fréquence allélique
A1 chez les femelles :

x1f(t) = [3 x1 - x 1f(t-1)]/2.

Cette équation se réarrange en :

x1f(t)- x 1 = -1/2[x1f(t-1) - x 1],

ce qui permet sa résolution. La relation étant valable pour toute génération, on obtient :
x1f(t) = (- 1/2)t [ x1f(0) - x 1] + x 1

Lorsque t augmente, (-1/2)t tend vers zéro et la fréquence allélique A 1 des femelles tend vers (x1).
Cette fréquence d'équilibre est évidemment celle de A 1 dans la population de départ ; elle sera atteinte de
manière graduelle. Au cours du temps l'écart à l'équilibre diminue de moitié à chaque génération. Chez les
mâles, la fréquence tend vers la même valeur mais avec une génération de retard. L'approche de l'équilibre se
fait par une série d'oscillations amorties.

A titre d'exemple considérons le cas extrême d'une population de base dans laquelle toutes les
femelles sont A2A2 et tous les mâles A1. Soit 0 la fréquence de l'allèle A 1 chez les femelles et 1 chez les
mâles. L'évolution de cette population est représentée sur la figure 4.3. On vérifiera sur ce graphique :

- que chez les mâles, la fréquence de l'allèle A 1 à une génération est égale à sa fréquence chez les
femelles de la génération précédente ;
- que chez les femelles, la fréquence de l'allèle A 1 à une génération est égale à la moyenne
arithmétique des fréquences de cet allèle chez les femelles et les mâles de la génération précédente ;
- que pour les deux sexes, les fréquences de l'allèle A 1 présentent au cours du temps des
oscillations qui s'amortissent rapidement. Il n'y a pas de perte d'allèles, mais redistribution entre les sexes. En
fait dès la sixième génération on a x 1m = 11/32, valeur très proche de l'état d'équilibre 1/3. Bien
qu'asymptotique l'équilibre est vite approché. On se souviendra cependant que dans le cas d'un locus
autosomique, l'équilibre de Hardy-Weinberg est atteint en une ou deux générations seulement.

4.4 SYSTEMES MULTI-LOCUS

Les populations naturelles sont généralement polymorphes pour de nombreux locus. Si une
population se trouve dans les conditions d'application de la loi de Hardy-Weinberg sa constitution génotypique
tendra vers un état d'équilibre qui est décrit par une généralisation du modèle à un locus.

4.4.1 ETUDE D'UN SYSTÈME À DEUX LOCUS AUTOSOMIQUES

4.4.1.1 Constitutions gamétique et génotypique à l'équilibre


IV-16

Soient deux locus différents A et B pouvant être occupés le premier par les allèles A 1 ou A2 et le
second par les allèles B1 ou B2. Il n'est pas nécessaire de dissocier le cas de locus situés sur un même
chromosome (physiquement liés) de celui de locus situés sur des chromosomes différents, étant donné que la
probabilité (r) de recombinaison entre les deux locus n'intervient pas sur la constitution génétique à l'équilibre,
comme nous le verrons ultérieurement. Dans le cas de locus physiquement liés, r est comprise entre 0 et 1/2 si
ces locus sont suffisamment proches (génétiquement liés) et égale à 1/2 si les locus sont très éloignés
(génétiquement indépendants). r est également égale à 1/2 si les locus sont situés sur des chromosomes
différents (physiquements indépendants).

La fréquence de l'allèle A 1 étant x1, celle de l'allèle A 2 sera x2 = 1-x1. On définit de façon similaire
la fréquence de l'allèle B1 (y1) et celle de l'allèle B 2 (y2=1-y1). Sous les hypothèses de Hardy-Weinberg, la
constitution génotypique à l'équilibre est donnée, pour chaque locus, par le développement des binômes :

(x1 + x2)2 et ( y1 + y2)2

Pour les deux locus pris simultanément, la constitution génotypique globale, à l'équilibre, sera
donnée par le développement du produit de ces binômes soit :

[(x1 + x2)2 ( y1 + y2)2] .

On aura par exemple une fréquence x 12y12 pour le génotype A1A1B1B1, ou 4x1x2y1y2 pour le
génotype A1A2B1B2. Pour d'établir les constitutions génétiques à l'équilibre, il est plus aisé de raisonner à
partir des fréquences gamétiques qu'à partir des fréquences génotypiques (tableau 4.1).

TABLEAU 4.1 : Constitution gamétique pour deux locus dialléliques, dans le cas de l'association au
hasard des allèles.
--------------------------------------------------------------------------------------------------
Allèles ( et fréquences) au locus A

A1 (x1) A2 (x2)
--------------------------------------------------

B1 (y1) A1 B1 A2 B1

Allèles (et
X11 = x1y1 X21 = x2y1
fréquences) --------------------------------------------------
IV-17

B2 (y2) A1 B2 A2 B2
au locus B
X12 = x1y2 X22 = x2y2

--------------------------------------------------------------------------------------------------

Il existe quatre types de gamètes possibles : A 1B1, A1B2, A2B1 et A2B2, de fréquences respectives
X11, X12, X21 et X22. On donne souvent le nom d'haplotype à ces combinaisons gamétiques: par exemple
haplotype A1B1. Si les gènes considérés sont associés au hasard dans les gamètes, la fréquence de chaque
haplotype sera simplement égale au produit des fréquences des allèles respectifs qui le constitue. Dans ce cas
la population est à l'état d'équilibre de Hardy-Weinberg et on la dit à l' équilibre d'association gamétique ou
simplement équilibre d'association. On emploie parfois le terme d'équilibre de liaison (linkage equilibrium).
Cette appellation n'est cependant pas très appropriée dans la mesure où elle laisse croire qu'il s'agit de gènes
physiquement liés. En fait le raisonnement est valable pour tous les locus. Les états d'équilibre des différentes
constitutions génétiques seront identiques, que les locus soient physiquement liés ou non. Comme nous le
démontrerons, seule la vitesse d'atteinte de l'état d'équilibre dépend du pourcentage de recombinaison.

Si à une génération donnée l'association aléatoire des allèles n'est pas réalisée lors de la formation
des gamètes, certains haplotypes présenteront des fréquences supérieures, ou inférieures, à celles attendues à
l'équilibre. La population n'est donc pas à l'état d'équilibre. Pour l'haplotype A 1B1 on peut alors écrire :

X11 = x1y1 + D,

où D est une valeur relative qui représente le déséquilibre d'association gamétique (dit aussi, mais de
façon moins xcorrecte, déséquilibre de liaison ou "linkage disequilibrium"). Les fréquences des autres
haplotypes seront modifiées avec la même valeur absolue. En effet, si la fréquence d'association des allèles est
modifiée, les fréquences alléliques, elles, ne le sont pas, car la population est toujours régie par le principe de
Hardy-Weinberg. La somme des fréquences des haplotypes A 1B1 et A1B2 par exemple, qui regroupent tous
les allèles A1, doit être égale à x1. Ceci implique que la fréquence des haplotypes A 1B2 soit :

X12 = x1y2 - D.

Dans ces conditions D est différent de zéro et la population est effectivement en déséquilibre
d'association gamétique. Les fréquences gamétiques réelles, fonctions des fréquences à l'équilibre et de D
(Lewontin et Kojima, 1960, Evolution 14:458), s'écrivent :

X11 = x1y1 + D
X12 = x1y2 - D
X21 = x2y1 - D
X22 = x2y2 + D,
IV-18

et les relations entre fréquences alléliques et fréquences gamétiques :

x1 = X11 + X12
x2 = X21 + X22
y1 = X11 + X21
y2 = X12 + X22,

On en déduit alors : D = X11 X22 - X12 X21.

Cette écriture permet de voir que D est égal au produit des fréquences des gamètes A 1B1 et A2B2
(dits en "couplage", ou en "position cis"), diminué du produit des fréquences des gamètes A 1B2 et A2B1 (dits
en "répulsion", ou en "position trans"). Cette dénomination, qui provient des gamètes obtenus dans les
croisements de dihybridisme, est utilisée ici de manière conventionnelle, par rapport aux indices des allèles.

Les valeurs extrêmes de D sont -0,25 et 0,25. Elles sont atteintes pour des fréquences alléliques
égales à 0,5 dans des populations où les haplotypes sont respectivement tous en répulsion (X 12 = X21 = 0,5,
X11 = X22 = 0, D = -0,25), ou tous en couplage (X 11 = X22 = 0,5, X12 = X21 = 0, D = 0,25).

La constitution génotypique globale de la population résulte de la rencontre des gamètes. Dix génotypes
possibles peuvent être formés si l'on distingue les doubles hétérozygotes en couplages (A 1B1/A2B2) des
hétérozygotes en répulsion (A1B2/A2B1). Si la constitution gamétique est en déséquilibre d'association, les
recombinaisons intra- ou inter-chromosomiques qui se produisent toujours vont détruire peu à peu les associations
préférentielles, et conduire la constitution génotypique de la population vers l'état d'équilibre où D sera nul.

4.4.1.2 L'approche de l'état d'équilibre

L'atteinte de l'état d'équilibre est fonction du degré de recombinaison entre les locus (génétiquement
indépendants: r=0,5, ou non indépendants: r<0,5). La recombinaison peut se produire chez tous les individus,
mais n'a de conséquence sur la modification des fréquences gamétiques que lorsqu'elle se produit chez un
double hétérozygote. Ce fait explique que même pour des locus indépendants, mais présentant un déséquilibre
d'association gamétique, l'atteinte de l'état d'équilibre soit graduelle.

Pour démontrer que la constitution gamétique de la population tend vers un état d'équilibre, il
convient d'établir les relations de récurrence des fréquences gamétiques entre deux générations successives.
Raisonnons sur la fréquence X11 des gamètes A1B1. Un gamète A1B1 peut être obtenu de deux façons
exclusives. S'il est produit sans recombinaison (probabilité 1 -r), sa probabilité d'être A 1B1 est égale à la
fréquence des A1B1 de la génération précédente, soit X 11(t-1). S'il est produit par recombinaison ( probabilité
r), les deux gènes A1 et B1 proviendront de parents différents (probabilité x 1y1). En effet, sous l'hypothèse
IV-19

panmictique, la probabilité de tirer A 1 et B1 est simplement le produit x 1y1, puisque ces allèles sont tirés au
hasard dans l'urne gamétique de chaque parent. Sous les hypothèses de la loi de Hardy-Weinberg ceci reste
vrai quelle que soit la génération considérée, les fréquences alléliques de chacun des locus étant constantes.

La probabilité totale d'obtention d'un gamète A 1B1 s'écrit donc :

X11(t) = (1 - r) X11(t-1) + r x1y1

En retranchant x1y1 à chacun des deux membres on obtient :

X11(t) - x1y1 = (1 - r)(X11(t-1) - x1y1)

c'est-à-dire

Dt = (1 - r) Dt-1

Cette relation étant valable à chaque génération, on obtient finalement :

Dt = (1- r)t D0,

où D0 est le déséquilibre d'association gamétique dans la population initiale. (1-r) étant <1, (1-r) t tend vers
zéro lorsque t augmente, et donc D t tend vers zéro. Le raisonnement s'applique de la même manière pour les
autres types de gamètes et la population tend vers l'état d'équilibre d'association gamétique.

Cette approche de l'état d'équilibre est fonction du taux de recombinaison. Elle sera la plus rapide
(sans toutefois être immédiate) pour des locus indépendants, et d'autant plus lente que pour des locus liés qu'ils
seront proches. Pour des locus indépendants elle décroît comme (1/2) t et sera donc d'environ 1/1000 ème de sa
valeur initiale au bout de 10 générations. Pour des locus liés, elle décroîtra plus lentement et deux gènes situés
à un centimorgan resteront en déséquilibre d'association gamétique durant des centaines de générations. La
figure 4.4 présente quelques exemples de diminution du déséquilibre gamétique pour différents taux de
recombinaison. Si les taux de recombinaison sont différents entre les sexes, l'évolution du déséquilibre est
pratiquement égale à celle obtenue en prenant pour valeur de r la moyenne de ces taux.

La valeur du déséquilibre d'association D dépend cependant en partie des fréquences alléliques. Pour
essayer d'obtenir des mesures indépendantes de ces fréquences Lewontin (1964, Genetics 49:49) a proposé un
autre coefficient D', exprimant D par rapport à la valeur maximale (D max) ou minimale (Dmin) que peut
atteindre D pour un lot de fréquences alléliques données.

Sachant que X12 = x1y2 - D > 0 implique D < x1y2


et que X21 = x2y1 - D > 0 implique D < x2y1,
IV-20

on déduit que la valeur maximale de D, pour x 1 et y2 données, est fournie par le plus petit de leurs
deux produits, soit :
Dmax = min (x1y2 , x2y1).

De façon similaire on obtient :


Dmin = max (-x1y1 , -x2y2).

On notera que Dmax ou Dmin sont toujours intermédiaires aux valeurs extrèmes D = 0,25 ou -0,25,
sauf si x1= x2 et y1= y2. En fonction du signe du déséquilibre, le coefficient de Lewontin s'écrit :
D' = D/Dmax ou D/Dmin.

4.4.1.3 Cas de deux locus multialléliques

Dans le cas de deux locus ayant chacun plusieurs allèles, une estimation possible du déséquilibre
d'association consiste à calculer pour chaque type génétique la valeur :

Dij = Xij - xiyj.

Cependant les valeurs des Dij sont fonction des fréquences alléliques, ce qui est génant lorsque l'on
souhaite comparer entre elles différentes paires alléliques. Dans ce cas une plus grande valeur d'un Dij ne
signifie pas obligatoirement que l'association allélique concernée est la plus importante. On préfère alors
normaliser ces valeurs par rapport à leur maximum possible, en utilisant la relation déjà vue :

D'ij = Dij/Dmax,

D'ij variant dans l'intervalle[-1 , 1].

D'autres estimateurs du déséquilibre d'association ont été étudiés et la notion étendue au cas de plusieurs locus
(voir notamment Hedrick, 1987, Genetics 117:331 et l'ouvrage de Weir, 1990).

4.4.2 CAUSES DU DÉSÉQUILIBRE D'ASSOCIATION

Les causes de déséquilibres d'association gamétique dans les populations sont de deux natures. Les
unes sont en rapport avec l'évolution démographique, les autres avec les processus sélectifs.

Dans le premier ensemble citons le cas de fusion entre deux populations possédant des fréquences
alléliques différentes pour deux locus concernés. Par ailleurs, la réduction momentanée de la taille de la
population peut également créer de telles situations, les fréquences des gamètes fondateurs n'étant pas à
IV-21

l'équilibre sous le simple fait du hasard. Les déséquilibres ainsi créés pourront persister d'autant plus
longtemps que les locus concernés seront proches.

La sélection, dans la mesure où elle favorise une combinaison gamétique particulière, peut être à
l'origine d' un déséquilibre d'association. Parfois un seul gène pourra être favorisé, entrainant les gènes non
sélectionnés qui l'entourent par un effet d'auto-stop (Hitchhiking effect). Les conséquences de ces phénomènes
sont décrites plus en détail au chapitre 7.

4.4.3 ESTIMATION DU DÉSÉQUILIBRE D'ASSOCIATION

L'estimation la plus précise du déséquilibre d'association gamétique nécessite la connaissance directe


des fréquences des quatre haplotypes possibles. Chez un organisme diploïde cette information n'est pas très
facilement accessible et on ne dispose le plus souvent que des fréquences génotypiques. Dans le cas de deux
locus possédant chacun des allèles codominants il y a 10 génotypes, si l'on compte les doubles hétérozygotes
en cis et en trans, mais ceux ci ne peuvent être distingués que par des techniques de retrocroisements lourdes à
mettre en oeuvre. On recourt alors à la méthode du maximum de vraisemblance qui permet d'obtenir le
meilleur ajustement possible entre les valeurs observées et les valeurs attendues sous un modèle donné (Pour le
détail de la théorie voir l'ouvrage de Weir, 1990).

En utilisant cette méthode, Hill (1974, Heredity 33:229) est parvenu au résultat résumé ci-après.

Soit Nij les effectifs des génotypes observés selon la relation :

A1A1 A1A2 A2A2


B 1B1 N11 N21 N31
B 1B2 N12 N22 N32
B 2B2 N13 N23 N33

On dénombre les différents types d'association (Gij) qui ne présentent pas d'ambiguité (ceci revient à
exclure les doubles hétérozygotes)

(A1B1) G11 = 2N11 + N12 + N21


(A1B2) G12 = 2N13 + N12 + N23
(A2B1) G21 = 2N31 + N21 + N32
(A2B2) G22 = 2N33 + N23 + N32

Les fréquences génotypiques attendues sont celles obtenues à partir des produits des fréquences
d'association gamétique soit :
IV-22

A1A1 A1A2 A2A2


B1B1 X112 2X11X21 X212
B1B2 2X11X12 2X11X22+2X12X21 2X21X22
B2B2 X122 2X12X22 X222

Pour un échantillon suffisamment grand, la fonction de vraisemblance permet de trouver la relation


entre l'estimateur X11, les données Gij, et les fréquences alléliques x 1 et y1. Ceci conduit à l'expression :

[G11 + N22X11 (1-x1-y1+X11)]


X11 = ------------------------------------------------
2N[X11 (1-x1-y1+X11) + (x1-X11)(y1-X11)]

avec x1 = (G11 + G12 + N22)/2N

et y1 = (G11 + G21 + N22)/2N

La résolution de l'équation peut être obtenue de façon itérative en choisissant une première valeur
approchée de X11 et en déduisant X11. On réintroduit cette valeur à la place de la précédente et on répète le
processus jusqu'à la convergence souhaitée. On en déduit l'estimation D par la relation : D = X 11 - x1y1.

Le processus de convergence n'est cependant pas toujours satisfaisant et la résolution directe de


l'équation cubique en X11 offre une solution plus satisfaisante. D'autres processus d'estimation sont donnés
dans l'ouvrage de Weir (1990).

4.5 MODELE DE HARDY-WEINBERG ET POPULATIONS NATURELLES

Bien que les hypothèses du modèle de Hardy-Weinberg soient des simplifications évidentes, son
utilité est grande pour plusieurs raisons. En effet, au niveau théorique il a permis de préciser les facteurs
pouvant modifier les constitutions génétiques des populations. En levant telle ou telle hypothèse on peut
rechercher le rôle propre de chacun de ces facteurs, puis en levant simultanément plusieurs hypothèses on
étudiera les effets cumulés des différents facteurs. De nombreux modèles théoriques ont ainsi été développés.

Au niveau pratique, le modèle de Hardy-Weinberg constitue une modèle de référence simple, dont on
peut tester la validité dans les populations naturelles. Tout écart observé peut alors être analysé en fonction des
modèles théoriques éloborés, et les facteurs influençant l'évolution de la population précisés.
IV-23

En outre, si dans une population donnée la constitution génétique en un locus étudié se trouve assez
près d'un équilibre de Hardy-Weinberg, on peut obtenir une estimation approchée, mais fort utile, des
fréquences alléliques.

4.5.1 TEST DE CONFORMITÉ AU MODÈLE DE HARDY-WEINBERG

Les populations de Drosophila melanogaster ont fait l'objet de nombreuses études de leur
polymorphisme enzymatique. Le tableau 4.2 présente les données observées pour cinq locus analysés à dix
ans d'intervale dans la localité de Mèze, située près de la ville de Sète (Hérault). Les fréquences alléliques et
leurs écart-types ont été estimés par la méthode présentée précédemment (4.1.2).

On note une bonne stabilité des fréquences alléliques aux différents locus. La variation observée au
locus a-Gpdh-1, paraît plutôt due à un effet d'échantillonage, puisqu' elle ne se retrouve pas dans les
populations voisines étudiées (Charles-Palabost et al., 1986, Entomol. exp. appl. 42:145).

Lorsque les effectifs sont suffisament élevés, l'adéquation des fréquences génotypiques aux
proportions de Hardy-Weinberg peut être testée par le critérium 2 de Pearson :

S(Nbre Génotypes observés-Nbre Génotypes théoriques) 2


2= __________________________________________________
(Nbre Génotypes théoriques)

La distribution de 2 suit pratiquement une loi de Khi-Carré lorsque les effectifs théoriques de
chaque génotypes sont supérieurs à cinq.
Ainsi pour le locus Est-6 de l'année 1973, les valeurs génotypiques attendues pour un échantillon
extrait d'une population à l'équilibre de Hardy-Weinberg sont :

FF = 10,41 FS = 49,27 SS = 58,32


d'ou la valeur :
2 = ( 7 - 10,41)2 / 10,41 + (56 - 49,27)2 / 49,27 + (55 - 58,32)2 / 58,32
= 2,23.

La distribution de 2 suit une loi de Khi-Carré à un degré de liberté. En effet, sur les trois classes
génotypiques observées, il ne reste qu'un seul degré de liberté, ces classes étant liées entre elles par deux
relations indépendantes :
IV-24

________________________________________________________

Locus N FF FS SS x s(x)
________________________________________________________

Acph-1 1973 240 231 9 0 0,981 0,006


1974 120 119 1 0 0,996 0,004
1983 202 202 0 0 1,000 -

Adh 1973 120 113 7 0 0,971 0,011


1974 120 116 4 0 0,983 0,008
1983 216 210 5 1 0,984 0,006

Est C 1973 120 109 10 1 0,950 0,014


1974 120 104 14 2 0,925 0,017
1983 217 172 42 3 0,889 0,015

Est 6 1973 118 7 56 55 0,297 0,030


1974 120 11 59 50 0,337 0,031
1983 76 7 37 32 0,335 0,038

 -Gpdh -1 1973 116 43 46 27 0,569 0,033


1974 120 33 55 32 0,504 0,032
1983 217 47 115 55 0,482 0,024

________________________________________________________

TABLEAU 4.2 : Analyse du polymorphisme enzymatique de la population de Drosophila melanogaster de


la région de Mèze (Hérault) de 1973 à 1983. N : effectif de l'échantillon, x : fréquence allélique, s(x) :
écart-type. (d'après Charles-Palabost et al., 1986).
IV-25

1) l'effectif total N (on doit obtenir trois valeurs théoriques dont la somme est égale à 118),

2) l'estimation d'une fréquence allélique (x 1 ou x2, car x1=1-x2), obtenue à partir de l'échantillon, et
qui est fonction des valeurs observées (relation x 1= D+1/2H du paragraphe 4.1.2).

La valeur théorique de la loi de Khi-Carré pour un degré de liberté est de 3,84, au seuil de 5%. La
valeur calculée 2= 2,23 étant inférieure à la valeur seuil, nous sommes conduits à ne pas rejeter l'hypothèse
selon laquelle l'échantillon observé provient d'une population à l'équilibre de Hardy-Weinberg.

On remarquera que l'acceptation de cette hypothèse n'est valable que pour le locus considéré. Il
convient de reprendre les calculs pous chaque locus que l'on souhaite étudier. D'autres test de conformité à la
loi de Hardy-Weinberg ont été élaborés, notamment dans le cas de petits échantillons. Le lecteur intéréssé
pourra se référer à l'ouvrage de Weir (1990).

4.5.2 ESTIMATION DE LA FRÉQUENCE D'UN ALLÈLE RÉCESSIF

De nombreux caractères sont déterminés par un système monogénique, où l'un des allèles (a) est
récessif. On ne peut estimer directement la fréquence de a à partir des fréquences phénotypiques de
l'échantillon sans hypothèse particulière. La plus simple consiste à admettre que la population est à l'équilibre
de Hardy-Weinberg pour ce locus. Dans ces conditions la fréquence allèlique de a est obtenue par la racine
carrée de la fréquence phénotypique des homozygotes récessifs de l'échantillon : x 2 = a

La phénylcétonurie est une maladie génétique causée par un allèle p que l'on trouve à l'état
homozygote chez les individus atteints. Les hétérozygotes Pp ne sont pas malades et sont qualifiés de "porteurs
sains". Dans les populations de l'Europe occidentale un enfant sur 10000 est atteint de phénylcétonurie à la
naissance. Cette maladie est très invalidante et on ne rencontre pas ou peu d'adultes pp. Il est cependant
probable que les couples parentaux se forment sans tenir compte de leur génotype au locus considéré. Ceci
conduit à inférer que les zygotes formés, et par extension (si la sélection intra-utérine est négligeable), que la
distribution des génotypes chez les nouveaux-nés a une constitution proche de celle définie par le modèle de
Hardy-Weinberg. La fréquence de p est alors estimée par :

x2 = (10 4 ) = 10-2

et celle des hétérozygotes par :

D = 2x1x2 = 2(1 - 10-2)(10-2) ~ 0,02, soit 1/50.


IV-26

Ainsi lorsqu'un allèle est rare dans une population, il s'y trouve essentiellement à l'état hétérozygote.
La fréquence des porteurs sains est loin d'être négligeable et l'on comprend l'intérêt de leur dépistage dans les
fratries où l'un des enfants est atteint d'une telle maladie.

4.5.3 LE SYSTÈME ABO DES GROUPES SANGUINS

L'étude du polymorphisme des groupes sanguins A, B, O sera abordée sous son aspect le plus simple.
On considère seulement 3 allèles, I A IB, et iO, de fréquences respectives x 1, x2 et x3. Compte tenu des

relations de dominance entre IA, IB et iO, les fréquences des différents génotypes et phénotypes à l'équilibre
de Hardy-Weinberg sont indiquées dans le tableau ci-après :

Génotypes IAIA IAiO IB IB IB i O iOiO IAIB


___________________________________________________________________________

Phénotypes
= groupes sanguins [A] [B][O] [AB]

fréquences
phénotypiques x12 + 2x1x3 x22 + 2x2x3 x32 2x1x2
__________________________________________________________________________

La méthode la plus simple permettant d'estimer les fréquences des différents allèles est la suivante.
En utilisant le tableau ci-dessus, on obtient les relations :

(A) + (O) = (x1 + x3)2

(B) + (O) = (x2 + x3)2

(O) = x 32.

Chaque terme entre parenthèses indique ici la fréquence des phénotypes dans l'échantillon étudié.

D'où l'on déduit les estimateurs :

x1 = 1 - (B) + (O)

x2 = 1 - (A) + (O)

x3 = (O).

4.5.3.1 Analyse des Provinces françaises


IV-27

L'étude menée sur les marqueurs génétiques dans les provinces françaises (revue in Ohayon et
Cambon-Thomsen, 1986) fournit un ensemble de données obtenues à partir d'un échantillon de 1386 familles
non apparentées, réparties sur 15 régions de France métropolitaine et au Québec (fig.4.5). les aires étudiées
couvrent l'ensemble du territoire en évitant les zones de passage et de fort brassage, et tiennent compte des
réalités géographiques et historiques.

Pour le groupe ABO, sur un total de 2673 individus analysés, les fréquences phénotypiques observées
sont les suivantes :

(A) = 0,4233 (B) = 0,0838


(O) = 0,4581 (AB) = 0,0348,

et les estimations des fréquences alléliques, par la méthode exposée ci-dessus :



IA : 1 = 0,2639
x
B 
I : 2 = 0,0612
x

iO : 3 = 0,6768
x
______
1,0019

Il existe cependant une légère déviation par rapport à 1, déviation due aux erreurs d'échantillonnage
et à la méthode utilisée. Afin d'obtenir de meilleures estimations diverses méthodes ont été développées. La
plus connue est celle de Bernstein. Si l'on pose :
d=1-( 1+
  + ),
x x2 x3
Bernstein propose pour nouvelles estimations :
 ' = (1 + d/2) 
x1 x1
 ' = (1 + d/2) 
x2 x2
 ' = (1 + d/2) (  + d/2)
x3 x3
En remarquant que :

( 1+
 +  ) + d/2 = 1 - d/2
x x2 x3

on voit que la somme des nouvelles estimées devient :

 ' +  ' +  ' = (1 + 1/2 d)(1 - 1/2 d) = 1 - 1/4 d 2


x1 x2 x3

d étant très petit, cette somme est très proche de 1. On peut d'ailleurs, par calcul itératif, reprendre

x
 ' et  ' comme nouvelles valeurs de départ et calculer ainsi  1",  ",  ". En fonction de
1', x2 x3 x x2 x3
l'échantillon étudié, on arrête l'itération lorsque la précision désirée est obtenue.
IV-28

On démontre que ce cycle d'itération converge pratiquement vers les estimations correctes obtenues
par la méthode du maximum de vraisemblance, et les variances de ces estimations ont été tabulées par Li
(1970, Ann. Hum. Genet. 34:189).

Les estimations obtenues par cette méthode pour la "population française" sont :

 = 0,262
x1
 = 0,060
x2
 = 0,677
x3

On remarque qu'elles sont très proches des premières estimations. Globalement, le test X 2 de Pearson
montre que la "population française" peut être considérée comme à l'équilibre de Hardy-Weinberg, pour le
locus ABO.

L'analyse détaillée montre cependant des différences régionales, la plus remarquable concerne l'allèle
IB dont la fréquence est 3 fois plus faible dans le Béarn (0,019) que pour l'ensemble de la France, ceci étant
corrélé avec une fréquence plus élevée de l'allèle i O (0,751). Comme nous l'avons déjà signalé la notion de
population mérite d'être analysée de manière critique.

4.5.3.2 Analyse des populations humaines

La distribution des groupes sanguins du système ABO a été très étudiée pour l'ensemble des
populations humaines. Les données obtenues mettent en évidence d'assez amples variations de fréquences
alléliques entre les différentes populations (tableau 4.3). D'une manière générale les fréquences alléliques sont
actuellement proches des valeurs attendues à l'équilibre de Hardy-Weinberg. Ce résultat ne signifie cependant
pas que ce système n'ait pas été soumis à l'effet de la sélection par le passé, ni même qu'il n'y soit pas encore
faiblement soumis à l'heure actuelle. Néanmoins la bonne adéquation avec le modèle permet d'obtenir des
estimations satisfaisantes des fréquences alléliques.

________________________________________________________________________

Population % des différents groupes % des allèles


IV-29

________________________________________________________________________

n [A] [B] [AB] [O] IA IB iO


________________________________________________________________________

Anglaise 500 43.4 7.2 3.0 46.4 26.8 5.2 68.0


Française 500 42.6 11.2 3.0 43.2 26.3 7.4 66.3
Italienne 500 38.0 11.0 3.8 47.2 23.7 7.7 68.6
Allemande ca. 500 43.0 12.0 5.0 40.0 27.9 8.9 63.2
Autrichienne ? 40.0 10.0 8.0 42.0 27.6 9.3 63.0
Serbe 500 41.8 15.6 4.6 38.0 26.9 10.7 62.4
Grecque 500 41.6 16.2 4.0 38.2 26.4 10.7 62.8
Bulgare 500 40.6 14.2 6.2 39.0 27.0 10.8 62.2
Arabe 500 32.4 19.0 5.0 43.6 20.9 12.8 66.3
Turque 500 38.0 18.6 6.6 36.8 25.6 13.5 60.9
Russe 1000 31.2 21.8 6.3 40.7 20.9 15.2 63.8
Juive 500 33.0 23.2 5.0 38.8 21.4 15.4 63.3
Malgache 400 26.2 23.7 4.5 45.5 16.8 15.3 67.9
Sénégalaise 500 22.6 29.2 5.0 43.2 14.9 18.9 66.1
Annamites 500 22.4 28.4 7.2 42.0 16.0 19.7 64.3
Indienne 1000 19.0 41.2 8.5 31.3 14.9 29.1 56.0
________________________________________________________________________

TABLEAU 4.3 : Répartition des fréquences phénotypiques et alléliques du système ABO dans diverses
populations humaines. n : effectif de l'échantillon étudié. (D'après Mourant,1983)
IV-30

Au niveau mondial, l'analyse des valeurs ainsi obtenues montre que les variations entre populations
humaines s'organisent en gradients, bien visibles à l'échelle des continents (fig. 4.6 à 4.8). Ainsi la fréquence
des allèles IA, qui est supérieure à 0,25 dans les populations d'Europe et de Turquie, décroît en allant vers le
Sud-Est asiatique. Les autres populations indigènes du monde ont généralement des fréquences inférieures.
Pour les allèles I B, on note un gradient inverse sur le continent eurasiatique, avec des fréquences très
basses à l'Ouest (< 0,10), s'élevant jusqu'à plus de 0,25 en Asie centrale. L'allèle i O, bien que le plus fréquent
dans l'espèce humaine (généralement > 0,50), présente aussi des variations, avec ses plus fortes fréquences
dans les populations d'origine amérindiennes (> 0,90). De manière particulièrement intéressante, certaines
populations locales présentent des fréquences alléliques significativement différentes des populations voisines:
population islandaise à très forte fréquence de l'allèle i O (0,75), ou population basque ayant la plus faible
fréquence de l'allèle I B (0,02) en Europe. Ces observations suggèrent, lorsqu'elles sont renforcées par l'analyse
d'autres systèmes génétiques et d'études éthno-linguistiques, l'existence d'une histoire particulière de ces
groupes. Ainsi le peuplement de l'Islande est attribué à des immigrants venus de Scandinavie et des iles
britanniques, mais la population constituée aurait subi de drastiques réductions d'effectifs au cours du temps,
ayant entraîné des fluctuations aléatoires des fréquences alléliques. Dans le cas de la population basque les
constitutions génétiques actuelles résulteraient d'un mélange entre un pool génique provenant de populations
prénéolithiques européennes et celui de populations néolithiques d'origine indo-européennes. Après plus de
6000 ans il n'est cependant pas possible de reconstruire en détail une histoire génétique qui s'inscrit dans le
réseau complexe des interactions entre populations voisines (Mourant 1983).

4.5.4 Déséquilibre d'associations gamétiques.

4.5.4.1 Analyses au niveau génétique.

Dans les populations animales étudiées pour des locus enzymatiques ou morphologiques, les valeurs
observées de déséquilibre d'association sont nulles ou pratiquement nulles, sauf si les gènes sont liés par moins
de 10 unités de recombinaison (Langley et al., 1978, Genet. Res.:32,215; Klarenberg et Scharloo, 1986,
Genetics 114:875, Sanchez-Prado et al., 1989, Genet. Sel. Evol. 21:33), ou sont associés à des inversions
chromosomiques (Prakash, 1977, Genetics 85:713; Voelker et al., 1978, Genetics 88:515). Dans ce dernier cas,
l'inversion limitant la recombinaison génétique, la sélection naturelle peut retenir, pour différents locus à
l'intérieur de chaque inversion, différents allèles présentant une interaction bénéfique.

On parle alors de coadaptation génique, et ce type d'association peut conduire à un déséquilibre


significatif (par exemple D = -0,012 pour une association entre gènes des locus de l' a-amylase et l'inversion
Nova Scotia chez D. melanogaster, soit 93 % du Dmin possible (Mukai et al., 1974, Genetics 77:771).

Des valeurs particulièrement élevées ont été observées dans des populations végétales, notamment
chez des espèces à fort taux d'autofécondation (D = -0,046 chez l'orge, soit 66 % du D min possible pour deux
locus indépendants codant pour des estérases.
IV-31

Dans les populations humaines la recherche de déséquilibres d'association est effectuée par des
enquètes familiales, surtout pour des gènes pathologiques, ou par des analyses de démographie génétique.
Plusieurs cas de déséquilibre d'association ont ainsi été décrits : au système MNSs, système rhésus, système
HLA, dans la région codant pour les chaines lourdes des immunoglobulines, ... Les déséquilibres observés
concernent des gènes pathologiques et des marqueurs proches (hémochromatose idiopathique et HLA-A3,
mucoviscidose et région d'ADN révélée par la sonde KM-19 présentant un RFLP pour un site Pst I), aussi bien
que pour des gènes non pathologiques : b-globine, hormone de croissance, insuline,... (revue in Feingold,
1991, médecine/sciences 7:161).

A titre d'exemple examinons le cas des systèmes MN et Ss, déterminés par deux ensembles de gènes
étroitement liés. L'enquête des "Provinces françaises" fournit les fréquences alléliques suivantes pour chacun
des locus :

M = 0,523 N = 0,477
S = 0,328 s = 0,672.

Les fréquences attendues des 4 haplotypes pour une population à l'équilibre de Hardy-Weinberg
diffèrent significativement des fréquences observées :

Fréq. attendues Fréq. observées

MS = 0,172 MS = 0,238
Ms = 0,351 Ms = 0,284
NS = 0,156 NS = 0,084
Ns = 0,321 Ns = 0,394

Les associations en "couplage" MS et Ns sont plus fréquentes qu'attendues et D est de l'ordre de


0,070 soit 45 % de la valeur maximale possible (D max = 0,156).
Ce résultat est tout à fait caractéristique des populations européennes actuelles. Il est également
interprété comme résultant d'importants brassages d'individus ayant concerné les groupes européens au cours
des derniers millénaires.
De tels déséquilibres d'association ont également été observés pour le système d'histo-incompatibilité
HLA. Dans ce système on connait au moins 4 locus différents situés sur la sixième paire de chromosomes. Les
deux locus HLA-A et HLA-B sont très proches (environ 0,8 centimorgan) et possèdent chacun de nombreux
allèles. Ce système est très polymorphe dans l'ensemble des populations humaines. Le tableau 4.4 présente les
fréquences alléliques observées dans l'enquête des provinces françaises pour les 4 locus A, B, Cw et DR. Il
révèle l'importance du polymorphisme existant, 7 à 20 allèles ayant une fréquence supérieure à 0,01 par locus.
Au niveau des associations géniques, 5500 haplotypes HLA ont été analysés. Près de 30 % ont une fréquence
IV-32

supérieure ou égale à 5 pour 1000. Parmi ces haplotypes en fort déséquilibre de liaison, les 10 plus fréquents
(valeur supérieure à 4 pour 1000) représentent environ 20 % du total des haplotypes.

Au niveau des combinaisons haplotypiques pour deux locus, on a observé 36 combinaisons HLA-
A,HLA-B en déséquilibre d'association significatif (AI,B8 ; A3,B7 ; A29,B44 ; ...), 22 entre HLA-B et HLA-
DR (B8,DR3 ; B7,DR2 ; B18,DR3 ; ...), et de très nombreuses autres sur l'ensemble des locus, ce qui témoigne
de l'importance et de la permanence des déséquilibres observés.

A titre d'exemple analysons le cas de l'haplotype prépondérant A1,B8. En moyenne dans la


population française sa fréquence observée est de 0,068 pour une fréquence attendue de 0,134 x 0,098 = 0,013.
Cette forte liaison se retrouve dans toutes les provinces étudiées (Ohayon et Cambon-Thomsen, 1986), les
valeurs observées de D y sont de l'ordre de 0,06 à 0,1. Cependant, dans une population panmictique et sans
sélection, il faut environ 200 générations pour réduire ce déséquilibre au 5 ème de sa valeur initiale. D'après
les calculs précedents on a en effet (avec r = 0,008) : D 200 = D0(1-0,008)200 = 1/5D0, soit D200 de
l'ordre de 0,01 à 0,02.

De telles valeurs seraient non significativement différentes de zéro, compte tenu des échantillons
disponibles. Il aurait ainsi suffi d'environ 200 générations (soit 5 à 6000 ans dans l'espèce humaine) pour que
ce déséquilibre de liaison ait pratiquement disparu. Ceci représente en fait un intervalle de temps court par
rapport à la durée de l'espèce humaine et on ne devrait plus trouver un tel déséquilibre. Ce type d'observation
suggère que l'association A1,B8 soit en fait maintenue par la sélection. Ce raisonnement a été étendu à
quelques autres associations privilégiées du système HLA (Vogel et Motulsky,1986).
IV-33

____________________________________________________________________________

Locus et fréquences alléliques aux différents locus

______________________________________________________________________
A B Cw Dr

A 2 0,273 44 0,165 7 0,203 3 0,160


l 1 0,134 7 0,102 4 0,130 7 0,150
l 3 0,131 8 0,098 5 0,093 5 0,142
è 24 0,091 35 0,091 3 0,092 4 0,134
l 29 0,068 51 0,072 6 0,075 2 0,134
e 11 0,058 18 0,061 2 0,052 1 0,103
s 31 0,041 W62 0,058 1 0,037 W6 0,099
28 0,037 17 0,041 autres 0,318 W8 0,014
32 0,033 14 0,039 W9 0,010
23 0,029 27 0,036 autres 0,054
26 0,029 W60 0,032
25 0,012 39 0,025
W33 0,011 W61 0,023
autres 0,053 49 0,022
W55 0,016
13 0,016
38 0,014
37 0,013
W50 0,012
autres 0,064
____________________________________________________________________________

TABLEAU 4.4 : Etude des marqueurs du Complexe Majeur d'Histocompatibilité dans la population
globale de l'enquête "Provinces Françaises" : fréquences alléliques estimées pour quatre locus, sur un
echantillon d'environ 5500 haplotypes. (D'après Ohayon et Cambon-Thomsen, 1986).
IV-34

4.5.4.2 Analyses au niveau moléculaire.

Avec les techniques d'analyse de la biologie moéculaire, l'étude de déséquilibre d'association peut
être abordée au niveau de l'ADN, soit par carte de restriction, soit par séquençage. On peut dès lors analyser
les déséquilibres d'association entre gènes et marqueurs anonymes, ou même à l'intérieur d'un gène entre bases
différentes.

Chez le Moustique Culex pipiens, l'utilisation massive d'insecticides organophosphorés a entraîné la


sélection d'individus produisant de fortes quantités d'estérases, enzymes intervenant dans la dégradation de
l'insecticide (Pasteur et al.. 1981, Biochem. Genet. 19:909) Au niveau génétique ceci corespond à
l'amplification de certains allèles des estérases de type A et B. La répartition géographique de la résistance due
à l'amplification de l'allèle B2 est très vaste et recouvre au moins trois continents (fig.4.9). L'analyse
moléculaire montre une identité des cartes de restriction de ces séquences quelle que soit leur origine
géographique (Raymond et al., 1991, Nature 350:151). Cette association génétique totale entre sites de
restriction permet de conclure que l'amplification de l'allèle B2 ne s'est produite qu'une seule fois ; sa
distribution actuelle s'explique par une migration à grande échelle. Compte tenu des données de terrain et de
l'histoire des résistances, l'apparition de cette amplification se serait produite dans les années 1960, en Afrique
ou en Asie et se serait rapidement répandue, probablement grâce aux transports internationaux.

Au niveau de la séquence nucléotidique, le très faible taux de recombinaison entre bases conduit à de
fortes associations. Cette notion d'association privilégiée peut permettre de discriminer un allèle ancien d'un
allèle apparu plus récemment. Une telle étude a été réalisée chez D. melanogaster qui possède, au locus de
l'alcool deshydrogénase, deux allèles Adh S et AdhF, largement répandus dans toutes les populations. Le
séquençage de 6 copies de l'ADN d'allèle Adh S et de 5 copies d'Adh F provenant de diverses régions du monde
a été réalisé par Kreitman (1983). La figure 4.10 montre les séquences obtenues pour la région entourant le site
(*), correspondant au changement d'une leucine chez S en une thréonine chez F. On note une grande
hétérogénéité de séquence pour S et une grande homogénéité pour F. Les recombinaisons étant très rares à si
courte distance, les allèles les plus récents seront donc les plus homogènes dans la région considérée. Dans le
cas étudié l'allèle F apparaît ainsi d'origine plus récente que celle de l'allèle S.

On remarquera enfin que la connaissance de la séquence exacte permet d'illustrer la notion d'allèles
isoactifs. Les individus AdhS/AdhS (ou AdhF/AdhF) ont bien un génotype homozygote, lorsque l'on
s'intéresse à l'activité de l'enzyme. Cependant, compte tenu des multiples mutations silencieuses accumulées,
on conçoit bien que tout individu homozygote (par exemple Adh S/AdhS) ne porte pas deux allèles ayant
exactement la même séquence, bien que codant pour la même fonction. Par définition il porte 2 allèles
isoactifs.
IV-35

Le modèle de Hardy-Weinberg présenté dans ce chapitre permet de concevoir la constitution


génétique d'une population non soumise aux forces évolutives. Nous examinerons maintenant différents
facteurs pouvant agir sur ces populations, et analyserons leurs impacts sur la constitution génétique.
IV-36

Légende des figures


Exemples de figures dont le lecteur cherchera l’illustration

Fig. 4.1 : Hypothèses conduisant à la constitution génétique d'une population dans le modèle de Hardy-Weinberg.
Pour un locus autosomique donné, les fréquences alléliques x 1 et x2 ne varient pas au cours des générations.

Fig. 4.2 : Relations entre fréquences génotypiques et fréquences alléliques dans le modèle de Hardy-Weinberg.

Fig. 4.3 : Evolution des fréquences d'un allèle hétérosomique vers l'état d'équilibre, pour des fréquences initiales
de 1 chez les mâles et de 0 chez les femelles.

Fig. 4.4 : Evolution du déséquilibre d'association gamétique (D) au cours des générations, en fonction de la
fréquence de recombinaison (r) entre deux locus.

Fig. 4.5 : Répartition par région, des familles étudiées dans l'enquête "Provinces Françaises". (D'après Ohayon et
Cambon-Thomsen, 1986).

Fig. 4.6 : Distribution de l'allèle I A du système ABO dans les populations indigènes humaines. (D'après Mourant,
1983).

Fig. 4.7 : Distribution de l'allèle I B du système ABO dans les populations indigènes humaines. (D'après Mourant,
1983).

Fig. 4.8 : Distribution de l'allèle i O du système ABO dans les populations indigènes humaines. (D'après Mourant,
1983).

Fig. 4.9 : Analyse de la résistance aux insecticides organophosphorés, par amplification du gène de l'estérase B2
chez le moustique Culex pipiens.
9a : cartes de restrictions de séquences provenant de différentes populations, Tem-R (souche californienne
résistante, contenant environ 250 copies du gène B1), S-Lab (souche californienne sensible), MSE (souche
française de faible activité estérasique), et six souches résistantes ayant amplifié le gène de l'estérase B2.
9b : distribution connue de cette amplification et migrations possibles. (D'après Raymond et al., 1991)

Fig.4.10 : Analyse moléculaire des allèles Adh S et AdhF du locus de l'alcool deshydrogénase chez Drosophila
melanogaster. Les sites nucléotidiques de 11 séquences provenant de différentes populations mondiales sont
comparés à ceux de la séquence consensus. Les points indiquent une identité de nucléotides avec cette séquence.
On notera l'homogénéité des allèles Adh F, tout particulièrement au niveau de l'exon 4 qui contient le nucléotide
(*) responsable de la mutation Leu(S)=> Thr(F). (D'après Li et Graur,1991).
IV-37

Légende des Tableaux

Tab. 4.1 : Constitution gamétique pour deux locus dialléliques, dans le cas de l'association au hasard des allèles.

Tab. 4.2 : Analyse du polymorphisme enzymatique de la population de Drosophila melanogaster de la région de


Mèze (Hérault) de 1973 à 1983. N : effectif de l'échantillon, x : fréquence allélique, s(x) : écart-type. (D'après
Charles-Palabost et al., 1986).

Tab. 4.3 : Répartition des fréquences phénotypiques et alléliques du système ABO dans diverses populations
humaines. n : effectif de l'échantillon étudié. (D'après Mourant, 1983).

Tab. 4.4 : Etude des marqueurs du complexe majeur d'histocompatibilité dans les populations de l'enquête
"Provinces Françaises" : fréquences alléliques estimées pour quatre locus, sur un échantillon d'environ 5500
haplotypes. (D'après Ohayon et Cambon-Thomsen, 1986).
IV-38

Vous aimerez peut-être aussi