Practica 2 Bioinformática
Practica 2 Bioinformática
Practica 2 Bioinformática
a
María Alejandra Londoño Ruales, b Daniela Maldonado Valero, c Catalina Marín
García, d Juan Miguel Restrepo Saavedra y e Geraldine Silva López
a
[email protected], b [email protected],
c
[email protected], d [email protected]
e
[email protected].
a, b, c, d y e
Universidad Santiago de Cali, Facultad de Ciencias Básicas, Programa
de Microbiología, Bioinformática
Septiembre de 2022
● ¿Cuáles son los valores de penalización para los “gaps”, tanto apertura
como extensión?
Los gap de extensión tienen una penalización de 0.5, mientras que los de
apertura tienen una penalización de 10 puntos
● ¿Qué significan los símbolos ":", "." y “l”? ¿Cuál es la diferencia entre
":" y "."?
El símbolo “:” significa que hay una similaridad baja, el símbolo “.” significa
que no hay coincidencia alguna y el símbolo “I” significa que coinciden los
aminoácidos alineados.
La diferencia entre “:” y “.” es que el primero indica una puntuación positiva
baja y el segundo garantiza de que no haya coincidencia.
BLOSUM30
BLOSUM90
● Pruebe las matrices PAM 10, PAM250 y PAM 500 para los alineamientos
● Explique las diferencias que observó para los alineamientos entre los
diferentes valores para cada tipo de matriz (BLOSUM y PAM). Explique
las diferencias que observó entre las matrices BLOSUM30 vs PAM 10 y
BLOSUM 90 vs PAM 500.
BLOSUM30 PAM10
BLOSUM90 PAM500
● ¿Cuáles son los valores de penalización para los “gaps”, tanto apertura
como extensión?
Los gap de extensión tienen una penalización de 0.5, mientras que los de
apertura tienen una penalización de 10 puntos
● Vaya a la opción “MORE OPTION” en el “STEP 2” y trate de modificar
las matrices de sustitución, así como los valores del GAP utilizadas por
DEFAULT. Examine más de cerca cómo estos parámetros influyen en
las puntuaciones y las alineaciones.
● Pruebe las matrices PAM 10, PAM250 y PAM 500 para los alineamientos
En cuanto a las matrices PAM, vemos que los porcentajes de identidad son
mayores en PAM250 (36.4%), mientras que los de similaridad son mayores
cuando se usa PAM 500 (67.8%), al igual que los porcentajes de GAPs que
son menores en esta matriz con diferencias bastante significativas entre
ellos. Esto se ve reflejado en el puntaje, siendo el mayor el de PAM 500, lo
que nos lleva a la conclusión de que esta es la matriz PAM más adecuada
para el alineamiento local de estas dos secuencias de aminoácidos.
Entre las BLOSUM y las PAM más bajas vemos como hay marcadas
diferencias, empezando por el largo de la cadena leída, siendo mayor en
PAM 10. Sin embargo, vemos como hay marcadas diferencias en cuanto a
los porcentajes de identidad y similaridad donde son mayores en BLOSUM
30, además de los porcentajes de GAPs que son mucho menores en
BLOSUM 30 que en PAM 10. Los puntajes se ve con una marcada
diferencia, donde el puntaje de BLOSUM 30 es el más alto, esto permite
inferir que en el caso de esta secuencia para realizar un alineamiento local
es mejor usar una matriz de BLOSUM más baja en comparación a una
matriz PAM baja debido a la divergencia de las secuencias.
BLOSUM90 PAM500
Para las BLOSUM y PAM más altas tenemos que en cuanto a los
porcentajes de identidad y similaridad hay semejanzas entre ellos donde no
hay una diferencia tan significativa, sin embargo en los porcentajes de GAPs
hay diferencias considerables, siendo en PAM 500 donde hay un porcentaje
más bajo (7.8%) y se ve reflejado en los puntajes finales por lo que podemos
deducir que es más apto usar una matriz PAM más alta para secuencias
divergentes como las dos usadas para este alineamiento.
● Establezca las diferencias que existen entre el alineamiento local y
global que realizó anteriormente, con la matriz BLOSUM62 para ambos
alineamientos.
Needleman Waterman
Hay que tener en cuenta que la matriz de default es en los dos algoritmos
anteriormente usados es BLOSUM62 y estos arrojaban resultados similares.
Se realizaron modificaciones en el algoritmo Needleman, cambiando la
matriz por BLOSUM 80 y disminuyendo las penalizaciónes por valores de 5
para GAPs de apertura y 0.2 para extendidos:
5.
Clustal Omega:
Secuencia Muscle:
Secuencia T-Coffee:
El símbolo “*” indica las posiciones que tienen un único residuo totalmente
conservado. En otras palabras, esté símbolo nos da a entender que las
secuencias son conservadas y son idénticas entre sí.
Hay otros símbolos como “:” que nos da a entender que hay conservación
entre grupos que tienen propiedades fuertemente similares o que hay una
mutación pero está conservada. El “.” significa que hay una conservación de
propiedades débilmente similares o que hay mutaciones semi conservativas.
Secuencia Muscle:
● Analice las diferencias obtenidas al utilizar las tres herramientas
(CLUSTAL-W, T-Coffee y MUSCLE) para realizar alineamientos
múltiples.
Secuencia de Clustalw:
Secuencia T-coffee:
Secuencia en Muscle:
Las diferencias que vemos al realizar estos 3 alineamientos son que Clustal
arroja una secuencia más corta y con un alineamiento más óptimo donde las
diferencias entre las secuencias no son tan notables y el porcentaje de GAPs
es muy bajo; contrario a esta vemos como el alineamiento con T-COFFEE es
más largo ya que usa un enfoque progresivo a diferencia de MUSCLE.
Adicionalmente, como ya se había mencionado previamente, con Clustal
podemos ver la cantidad de aminoácidos que se alinean en cada secuencia,
con valores muy parecidos en cada una de las filas de los bloques.
Clustal Omega:
Secuencia Muscle:
Secuencia T-Coffee:
● Analice las diferencias obtenidas al utilizar las tres herramientas
(CLUSTAL-W, T-Coffee y MUSCLE) para realizar alineamientos
múltiples:
El símbolo “*” indica las posiciones que tienen un único residuo totalmente
conservado. En otras palabras, esté símbolo nos da a entender que las
secuencias son conservadas y son idénticas entre sí.
Hay otros símbolos como “:” que nos da a entender que hay conservación
entre grupos que tienen propiedades fuertemente similares o que hay una
mutación pero está conservada. El “.” significa que hay una conservación de
propiedades débilmente similares o que hay mutaciones semi conservativas.