Medida de La Diversidad Genetica Clase
Medida de La Diversidad Genetica Clase
Medida de La Diversidad Genetica Clase
Medidas de la diversidad
genética
Que conocemos de la Diversidad
Pj = q ≤ 0.95 o Pj = q ≤ 0.99
Proporción de loci polimórficos
P = npj/ntotal
Abundancia de variantes alélicas (A)
K
n= ( 1/K ) ∑ ni
i=1
Número efectivo de alelos (Ae)
Ae = 1/(1 – h) = 1/Σpi2
Cálculo de Ae: Un ejemplo
Loci (A, B, C) Población 1 Población 2
Individuo 1 A1 A 1 B1 B1 C1 C1 A1 A1 B1 B3 C1 C1
Individuo 2 A1 A 2 B1 B2 C2 C2 A1 A1 B2 B3 C1 C1
Individuo 3 A1 A 1 B1 B1 C1 C3 A2 A2 B1 B4 C1 C1
Individuo 4 A1 A 3 B1 B3 C2 C3 A2 A2 B1 B1 C1 C1
Individuo 5 A3 A 3 B3 B3 C3 C3 A1 A2 B4 B4 C1 C1
Número de alelos 3 3 3 2 4 1
Frecuencia del alelo 1 0.60 0.60 0.30 0.50 0.40 1.00
Frecuencia del alelo 2 0.10 0.10 0.30 0.50 0.10 0.00
Frecuencia del alelo 3 0.30 0.30 0.40 0.20 0.00
•18
•Demostración del principio de H-W
•Generación 0
•Apareamiento
•N ∞
•♂ gametos al azar
•A1 •A2
•A1 A1 , A1 A2 , A2 A2
•Cigotos
•A 1 •A2
•Frecuencias •p2, 2pq, q 2 •♂ •A •A
•♀ •(p) •(q
genotípicas )
•♀ gametos • A11 A1 (p2) • A21 A2 (pq)
•A
1
•(p)
Locus A
Locus B
Locus C
Locus D
Locus E
Lectura M 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
de datos
Locus A 1,1 0,1 1,1 0,1 0,1 0,1 0,1 0,1 0,1 1,0 0,1 0,1 0,1 0,1 0,1 1,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 1,0 0,1 0,1 1,1 0,1 0,1 0,1
Locus B 0,1 0,1 0,1 0,1 0,1 1,1 0,1 0,1 0,1 0,1 0,1 0,1 0,1 1,0 1,0 1,0 0,1 0,1 0,1 0,1 0,1 0,1 1,0 0,1 1,1 0,1 1,0 1,0 1,0 1,1
Locus C 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0
Locus D 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0
Locus E 0,1 1,1 0,1 1,1 0,1 1,0 1,1 1,0 1,1 1,1 1,1 1,0 1,0 1,0 1,0 1,0 1,0 1,0 1,0 0,1 0,1 1,0 1,0 1,0 1,0 1,0 1,1 1,1 0,1 0,1
Cálculo de la diversidad con un marcador
molecular codominante (continuación)
Genotipos A1 A1 A1 A2 A2 A2 Total
Frecuencia genotípica (obs.) P11 = 0.07 P12 = 0.13 P22 = 0.80 1 0.13 0.87 0.23
Genotipos B1 B1 B1 B2 B2 B2 Total
Frecuencia genotípica (obs.) P11 = 0.23 P12 = 0.10 P22 = 0.67 1 0.28 0.72 0.41
Genotipos E1 E1 E1 E2 E2 E2 Total
Frecuencia genotípica (obs.) P11 = 0.50 P12 = 0.27 P22 = 0.23 1 0.63 0.37 0.46 0.22
Locus A
Locus B
Locus C
Locus D
Locus E
Lectura
M 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
de datos
Locus A 1 0 1 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0
Locus B 0 0 0 0 0 1 0 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 1 0 1 0 1 1 1 1
Locus C 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Locus D 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
Locus E 0 1 0 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 1 1 1 1 1 1 1 0 0
Cálculo de la diversidad con un marcador
molecular dominante (continuación)
Frecuencia hj = Hi
Locus Análisis de datos alélica (1 - p2 – q2)
Genotipos AA Aa aa Total
Genotipos BB Bb bb Total
Genotipos EE Ee ee Total
gST = 1 – (hS/hT)
hS = diversidad de la subpoblación
hT = diversidad total
[0-1]
Una población se define …
Ecológicamente como:
Un grupo de individuos de la misma especie que habitan
dentro de una zona geográfica restringida que permite el
apareamiento de dos individuos cualquiera
Genéticamente como:
Un grupo de individuos que comparten un acervo genético
común y tienen la posibilidad de aparearse
Diferenciación entre poblaciones respecto a
varios loci (GST)
GST = DST/HT
HT= HS + DST
Pob2 HT = la diversidad génica total
HS HS = la diversidad génica dentro de una
población
HT DST DST
•DST = la diversidad entre poblaciones
(HT/HT) = (HS/HT) + (DST/HT) = 1
Pob1 Pob3 •[0-1]
HS DST HS
Estadísticos F (Wright)
FIT = 1 – (HI/HT)
FIS = 1 – (HI/HS)
FST = 1 – (HS/HT)
Términos
Coeficiente de endogamia o índice F
F= ( He−Ho ) He
F es el coeficiente de endogamia y cuantifica la
reducción de la heterocigosidad
Relación entre frecuencia genotípica y
alélica en HW
Términos
• Panmixia: Sistema de apareamiento en el
que la elección de pareja se realiza al azar
•Assortative mating
•(Apareamiento selectivo)
•41
Interpretación de valores FST
0 1
(no existe divergencia (fijación para alelos
genética) alternos en diferentes
subpoblaciones)
de 0 a 0.05 pequeña
de 0.05 a 0.15 moderada
de 0.15 a 0.25 grande
>0.25 muy grande
Sistemas de reproducción y apareamiento
Línea pura
Rey Carlos II de España
•¿Qué sucede en la autogamia?
•%
•100.0
•75.5
•50.0
•25.5
•Heterocigosis
•Homocigosis
•0.
0• 0 1 2 3 4 5 6 7 8
•Generaciones
Ubicación geográfica de las ardillas
•Área de estudio
¿Que relación hay entre el tamaño de
la isla y los índices analizados?
¿Que pasara en esta isla con respecto
a las otras?
¿La cobertura vegetal que indica?
¿Que puede concluir de esta
información?
Utilizando la información anterior
• Medite en su respuesta utilizando la nueva
evidencia que se presenta a continuación.
Población migratoria Y
Frecuencia genotípica
Pob.
A1 A1 A1 A2 A2 A2 pi qi 2piqi F
1 0.25 0.50 0.25 0.50 0.50 0.500 0.0000
2 0.80 0.10 0.10 0.85 0.15 0.255 0.6078
Frecuencia genotípica
Pob.
A1 A1 A1 A2 A2 A2 pi qi 2piqi F
1 0.40 0.30 0.30 0.55 0.45 0.4950 0.3939
2 0.60 0.20 0.20 0.70 0.30 0.4200 0.5238
Tipos de polinización
•¿Cual es el
efecto esperado
en el síndrome
de polinización?
•¿aves,
mamíferos,
insectos, viento y
agua polinizan
igual?
¿Cual es la relación entre las migraciones de individuos y la
diferenciación genética de las poblaciones?
Análisis de varianza molecular (AMOVA)
AMOVA es un método que sirve para estudiar
la variación molecular dentro de una especie
Se basa en un modelo jerárquico o anidado
Se diferencia de un análisis de varianza
(ANOVA) en que:
• Puede contener diferentes suposiciones evolutivas
sin modificar la estructura básica del análisis
• La hipótesis utiliza métodos de permutación que no
requieren la suposición de una distribución normal
Niveles jerárquicos
• 1. Continentes, que pueden contener niveles
jerárquicos menores
• 2. Regiones geográficas dentro de un continente
• 3. Zonas dentro de una región, en un continente
• 4. Poblaciones dentro de una zona de una región,
en un continente
• 5. Individuos dentro de una población en una zona
de una región, en un continente
Un ejemplo de AMOVA
Ind. Pob. 1 Pob. 2 Pob. 3 X...k 15 21 18 54
A1 A2 A1 A2 A1 A2 X...k2 225 441 324 990
1 0 0 0 1 1 1 ∑∑Xi...k2 27 33 28 88
2 1 1 0 1 1 1
∑∑∑Xijk2 15 21 18 54
3 0 0 1 1 0 1
X...2 2916
4 1 0 1 0 1 1
5 0 0 0 1 0 1
6 0 0 0 1 0 0 Sca 0.6 CMa 0.3
10 1 1 1 0 0 1
11 1 0 0 1 1 1 •15 individuos
12 0 0 1 1 1 0
A1 = 1 Presente
13 1 1 1 1 0 1 •2 alelos
A1 = 0 Ausente
14 1 1 1 0 1 0
15 1 1 0 1 1 0
Procedimiento
• Convertir en variables binarias las bandas detectadas en los geles
, asignando un valor de 0 ó de 1.
• Calcular las sumas de las presencias (1) para proceder con la
suma de cuadrados.
• Se realizan primero los cálculos para una población y se
continúa con las demás hasta completar (X...k). Tenemos i = 15
individuos (efecto b), j = 2 alelos (efecto w), k = 3 poblaciones
(efecto a).
Un ejemplo de AMOVA (continuación)
FV gl SC CM CME
Poblaciones 2 0.6 0.3 σw2 + 2σb2 + 2*15σa2
Indiv./población 42 11 0.26190476 σw2 + 2σb2
Dentro de indiv. 45 10 0.22222222 σw2
Cálculos de varianzas y estadísticos F
σa2 0.0012698
σb2 0.0198413
σw2 0.2222222
σ2 0.24333
FIT 0.086758
FIS 0.0819672
FST 0.0052185
(1 - FIT) 0.91324
(1 - FIS)(1 - FST) 0.91324
Calculo de estadísticos F
πX = n/(n – 1)ΣXiXjπij
Cálculo de la diversidad de nucleótidos
dentro de una población
n Secuencia Frec. Xi
5 Sec1 TCC T CGAT T ATTC C CAGGGTGC C GATG A AT 5/10 = 0.5
10
Π1,2 = 2/30, Π1,3 = 4/30, Π1,4 = 3/30, Π2,3 = 4/30, Π2,4 = 3/30, Π3,4 = 5/30
π X = 10/(10 – 1)ΣXiXjπij
= (10/9)[0.5 0.2 (2/30) + 0.5 0.1 (4/30) + ... + 1 0.2 (5/30)]
= 0.037
Utilización de datos de secuencia:
Diversidad de nucleótidos entre poblaciones
VXY mide la divergencia poblacional con base en el grado de
variación de la secuencia (1 secuencia, 2 poblaciones)
VXY = dXY – (πX + πY)/2
VW mide la diversidad promedio en una población con base
en diversas secuencias
VW = (1/s)ΣπX
Vb mide la diferenciación total en diversas poblaciones
Vb = [1/(s(s – 1))]ΣXΣYVXY
NST es la diferenciación relativa
DNAMAN
Utilización de datos de restricción:
Variaciones en patrones de bandas
Sitio de restricción EcoRI
Fragmento 1 Fragmento 2
ADN …GACTGAATTCCACGGCACTGACGAATTCGA…AGTGAATTCTTACTTAAGCTAGCCTGAATTCGATAC…
Indiv. 1 …CTGACTTAAGGTGCCGTGACTGCTTAAGCT…TCACTTAAGAATGAATTCGATCGGACTTAAGCTATG…
Fragmento 1 Fragmento 2
ADN …GACTGATTTCCACGGCACTGACGAATTCGA…AGTGAATTCTTACTTAAGCTAGCCTGAATTCGATAC…
…CTGACTAAAGGTGCCGTGACTGCTTAAGCT…TCACTTAAGAATGAATTCGATCGGACTTAAGCTATG…
Indiv. 2
No existe sitio de
reconocimiento M I1 I2
para EcoRI
Fragmento 2
¿? Fragmento 1
Gel
Utilización de datos de restricción:
Diversidad de nucleótidos dentro de una
población
π = - (1/r)ln G
(si π < 5%)
Utilización de datos de restricción:
Diversidad de nucleótidos entre poblaciones
Individuos 01 02 03 04 05 06
01 0
1 0 1 1 0 1
02 0.56 0
1 0 0 0 1 1
03 0.33 0.33 0
m
D a 0 1 1 0 1 0
a r 04 0.47 0.26 0.50 0
t c
o a 1 0 0 0 1 1
s d 05 0.32 0.43 0.37 0.28 0
o
d r
e e 0 0 1 1 0 0 06 0.33 0.56 0.56 0.37 0.46 0
s
Ind5
1 1 1 0 0 0
3. Expresión de las relaciones Ind3
1 0 1 0 1 1
entre los resultados obtenidos Ind6
con diferentes tipos de Ind4
Ind2
caracteres Ind1
Tipos de variables
Cualitativas. Se refieren a caracteres o
cualidades, y son binarias o categóricas:
• Binarias, cuando reciben solamente dos valores:
presente (1) o ausente (0)
• Categóricas, cuando reciben un valor entre varias
posibilidades y pueden ser ordinales o nominales:
Ordinales: categorías que tienen un orden
Nominales: categorías que no tienen relación
entre sí
Cuantitativas. Son numéricas y pueden ser
continuas o discretas:
• Continuas, cuando toman un valor dentro de un
rango dado
• Discretas, cuando toman números enteros
Cuantificación de las relaciones genéticas:
Distancia
t t
d d1
t+1
t+1
d d2
2. La distancia genética
para cualquier UTO dada puede incorporarse en estudios filogenéticos. El
modelo contempla las frecuencias alélicas en las UTOs y su fundamento
matemático es diferente. Puede utilizarse con marcadores codominantes y
dominantes; no obstante, con éstos últimos, se pierde información porque
solamente se pueden calificar dos genotipos. La distancia genética con
marcadores dominantes requiere que se examinen dos generaciones de la
misma población para medir la segregación de los loci
Modelos de desequilibrio: Distancia
geométrica
Coeficiente de Jaccard:
a/(a + b + c)
2 3
4
1 2 3 3 2 4 1
Métodos de agrupación
Pasos a seguir:
• Se define la cercanía
• Se estima cada agrupación, según la distancia
• Se conforman las ramas del dendrograma en cada
ciclo
Grupo 1 Grupo 2
Ligamiento simple: Un ejemplo
(1) (2)
A B C D B C AD
A 0 B 0
B 0.30 0 C 0.35 0
C 0.43 0.35 0 AD 0.30 0.40 0
D 0.28 0.60 0.40 0
d(1,2)
d(1,2) = distancia mayor
entre dos UTO
Grupo 1 Grupo 2
Ligamiento completo: Un ejemplo
(1) (2)
A B C D A C BD
A 0 A 0
B 0.30 0 C 0.43 0
C 0.43 0.35 0 BD 0.30 0.40 0
D 0.28 0.60 0.40 0
C
Ligamiento promedio
O ‘método de agrupamiento de pares no
ponderados usando la media aritmética’
(UPGMA)
Minimiza la distancia entre grupos, al tomar la
distancia promedio de todos los pares entre los
individuos de la muestra
Método más empleado
C
0.40
0.4325
0.4325 0.35 0.28
Selección de un método de agrupación
Validación externa
Validación interna
Validación relativa
‘Bootstrapping:
– Es un método de remuestreo con reemplazo, con la
misma matriz de datos. Permite el cálculo de las
desviaciones estándar y varianzas, y es útil para
aquellas situaciones en las cuales el número de
muestras o los recursos (por ejemplo, el tiempo, el
presupuesto) son limitados.
Validación mediante ‘bootstrapping’:
Un ejemplo
(1) P1 P2 P3 P4 B (2)
A
C P1 P2 P3 P4
L1 1 0 0 1
D 0 1 0 1
L2
E
Gel L3 1 0 1 1
L4 1 1 0 0
L5 0 0 datos0
Matriz de 1
(3)
P1 P2 P3 P4
P1 1
P2 0.400 1
P3 0.600 0.400 1
P1 1
Matriz de similitud promedio
con desviaciones estándar P2 0.267 ± 0.115 1
1 1
3 3
4 2
2 4
0.11 0.33 0.56 0.78 1.00 0.25 0.44 0.63 0.81 1.00
Visualización de las relaciones: Ordenación