Practica 2 Bioinformática

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 29

PRÁCTICA 2: ALINEAMIENTO DE SECUENCIAS PAREADOS Y MÚLTIPLES

a
María Alejandra Londoño Ruales, b Daniela Maldonado Valero, c Catalina Marín
García, d Juan Miguel Restrepo Saavedra y e Geraldine Silva López
a
[email protected], b [email protected],
c
[email protected], d [email protected]
e
[email protected].
a, b, c, d y e
Universidad Santiago de Cali, Facultad de Ciencias Básicas, Programa
de Microbiología, Bioinformática

Santiago de Cali, Colombia

Septiembre de 2022

1. Vaya a la base de datos UniProt, busque y descargue en formato FASTA


las secuencias para OPRM_RAT y SSR1_HUMAN. ¿Diga qué proteínas
son y a qué organismos corresponden? (Incluya pantallazo con las
secuencias encontradas).

Esta secuencia corresponde a la proteína receptor opioide tipo mu que se


encuentra en la rata (Rattus norvegicus). Es un receptor de opioides
endógenos como la B-endorfina y endorfina, también opioides naturales y
sintéticos como la morfina, heroína, fentanilo y metadona; también se activa
por péptidos de encefalina. Media una serie de respuestas celulares
posteriores como la inhibición de la actividad de las adenilato ciclasas y
algunos canales de calcio y activa canales de potasio.
Esta secuencia corresponde a la proteína receptor somatostatina tipo 1 que se
encuentra en el humano (Homo sapiens). Es un receptor de la somatostatina;
esta se acopla al receptor por medio de proteínas G sensibles a la toxina
pertussis y a la inhibición de la adenil ciclasa. Además, estimula la
fosfotirosina fosfatasa.

2. Vaya al servidor EMBL-EBI y realice alineamientos utilizando las


proteínas que acaba de descargar y responda las siguientes preguntas:

● Haga un alineamiento global con estas dos secuencias con el algoritmo


Needleman, seleccionando la opción correspondiente con los
parámetros por default. Use pantallazos para comprobar que realizó el
ejercicio, así como para demostrar las respuestas de las siguientes
preguntas:

● ¿Cuáles son los porcentajes de identidad y similaridad del alineamiento?


El porcentaje de identidad es de 36.4% (157/431) mientras que el de
similaridad es de 52.7% (227/431).
● ¿Cuál es la matriz de sustitución que se usó por default?
La matriz usada por defecto fue BLOSUM62

● ¿Cuáles son los valores de penalización para los “gaps”, tanto apertura
como extensión?
Los gap de extensión tienen una penalización de 0.5, mientras que los de
apertura tienen una penalización de 10 puntos

● ¿Qué significan los símbolos ":", "." y “l”? ¿Cuál es la diferencia entre
":" y "."?

El símbolo “:” significa que hay una similaridad baja, el símbolo “.” significa
que no hay coincidencia alguna y el símbolo “I” significa que coinciden los
aminoácidos alineados.

La diferencia entre “:” y “.” es que el primero indica una puntuación positiva
baja y el segundo garantiza de que no haya coincidencia.

● Vaya a la opción “MORE OPTION” en el “STEP 2” y trate de modificar las


matrices de sustitución, así como los valores del GAP utilizadas por
DEFAULT. Examine más de cerca cómo estos parámetros influyen en las
puntuaciones y las alineaciones.

Se hicieron las siguientes modificaciones para los parámetros dados:


Al realizar de nuevo los alineamientos obtenemos una puntuación más alta, de
1059.399 en comparación con la default de 699.5. Esto es debido a que en nuestra
nueva modificación en GAP OPEN y GAP EXTEND se aumentan o disminuyen las
penalizaciones de estos, de tal manera que la secuencia no se vea tan afectada por
los GAPs que tienden a disminuir el porcentaje. Esto también nos permite una mayor
lectura, porcentaje de identidad y similaridad, entre otros.

● Pruebe las matrices BLOSUM30 y BLOSUM90 para los alineamientos y


compare el resultado con el alineamiento anterior.

BLOSUM30
BLOSUM90

Al hacer los alineamientos de nuevo obtenemos que con BLOSUM 30 los


porcentajes de identidad y similaridad son de 36.6% y 56.7%
respectivamente. Al hacerlo con BLOSUM 90 obtenemos una identidad del
37.5% y similaridad del 50.8%; vemos como los porcentajes de identidad son
bastantes similares en ambas matrices, sin embargo los porcentajes de
similaridad aumentan usando BLOSUM 30.
Respecto al alineamiento anterior que fue hecho con BLOSUM 50 vemos
que la similaridad está en el medio de ambas, con un porcentaje de 54.7%,
sin embargo la identidad es mayor en esta que con las nuevas dos matrices
usadas.

A partir de esto podemos ver que, al ser divergentes, es más conveniente


usar un BLOSUM más bajo como el 30 que disminuye el porcentaje de
GAPs y aumenta el puntaje del alineamiento.

● Pruebe las matrices PAM 10, PAM250 y PAM 500 para los alineamientos

PAM 10 PAM 250 PAM 500

● Examine cómo estos parámetros influyen en las puntuaciones y los


alineamientos.

El porcentaje de mutaciones aceptadas (PAM) es otra de las matrices de


sustitución para alineamientos pareados. Contrario a BLOSUM, entre más
alto sea el PAM va a ser mejor en el caso de estas secuencias ya que son
divergentes; es por esto que vemos que el mejor puntaje se obtiene en
PAM500 que en PAM10. Las puntuaciones y alineamientos son bastante
diferentes entre la más baja y la más alta ya que podemos ver como los
GAPs tienen un mayor porcentaje entre más bajo y van disminuyendo su
porcentaje a medida que se aumenta el número de la matriz.

● Explique las diferencias que observó para los alineamientos entre los
diferentes valores para cada tipo de matriz (BLOSUM y PAM). Explique
las diferencias que observó entre las matrices BLOSUM30 vs PAM 10 y
BLOSUM 90 vs PAM 500.
BLOSUM30 PAM10

Al usar los BLOSUM y PAM más altos se observan diferencias notables


entre los puntajes obtenidos, siendo el PAM el que tiene un menor puntaje y
porcentajes de identidad y similaridad muy bajos, mientras que los
porcentajes de GAPs son muy altos. Es por esto que, como se mencionó
anteriormente, al ser secuencias divergentes es mejor usar BLOSUM30.

BLOSUM90 PAM500

En cuanto a los BLOSUM y PAM más altos tenemos lo contrario al anterior


caso. Vemos como en el caso de BLOSUM los porcentajes de identidad son
más bajos, sin embargo, a pesar de que el porcentaje de identidad es mayor
en este, los GAPs tienen porcentajes muy altos que se ve reflejado en el
puntaje final. Esto nos lleva a la conclusión de que es más conveniente usar
el PAM 500 en comparación con BLOSUM 90 debido a la divergencia de de
las secuencias alineadas.

● Haga un alineamiento local con estas dos secuencias con el algoritmo


Smith-Waterman y responda las mismas preguntas anteriormente
formuladas para este alineamiento local.
● ¿Cuáles son los porcentajes de identidad y similaridad del alineamiento?

El porcentaje de identidad es de 38.1% (156/409) mientras que el de


similaridad es de 54.8% (224/409).

● ¿Cuál es la matriz de sustitución que se usó por default?

La matriz usada por defecto fue BLOSUM62

● ¿Cuáles son los valores de penalización para los “gaps”, tanto apertura
como extensión?

Los gap de extensión tienen una penalización de 0.5, mientras que los de
apertura tienen una penalización de 10 puntos
● Vaya a la opción “MORE OPTION” en el “STEP 2” y trate de modificar
las matrices de sustitución, así como los valores del GAP utilizadas por
DEFAULT. Examine más de cerca cómo estos parámetros influyen en
las puntuaciones y las alineaciones.

Se realizaron algunos cambios como en la matriz (PAM 200) y se bajaron los


puntajes de penalizaciones para los GAPs:

Cuando se realiza el alineamiento se obtienen los siguientes resultados:

Respecto a los porcentajes de identidad y similaridad vemos como son más


altos usando esta matriz que la que se da por default, además los GAPs
tienen un porcentaje más bajo usando la matriz de default. Sin embargo, el
puntaje usando esta nueva matriz y nuevos valores de penalización, es más
alto por el hecho de que se disminuyeron estos valores que afectan
negativamente el puntaje total.

● Pruebe las matrices BLOSUM 30 y BLOSUM 90 para los alineamientos y


compare el resultado con el alineamiento anterior.
Respecto a estos BLOSUM usados, los 3 porcentajes de identidad son
similares (38.3%, 38.1% y 39.6% respectivamente) en todos los BLOSUM,
los porcentajes de similaridad son mayores en el BLOSUM 30 siendo del
58.7%. Los puntajes totales nos llevan a la conclusión de que BLOSUM 30
es la mejor matriz para realizar este alineamiento local ya que son
secuencias divergentes.

● Pruebe las matrices PAM 10, PAM250 y PAM 500 para los alineamientos

En cuanto a las matrices PAM, vemos que los porcentajes de identidad son
mayores en PAM250 (36.4%), mientras que los de similaridad son mayores
cuando se usa PAM 500 (67.8%), al igual que los porcentajes de GAPs que
son menores en esta matriz con diferencias bastante significativas entre
ellos. Esto se ve reflejado en el puntaje, siendo el mayor el de PAM 500, lo
que nos lleva a la conclusión de que esta es la matriz PAM más adecuada
para el alineamiento local de estas dos secuencias de aminoácidos.

● Examine cómo estos parámetros influyen en las puntuaciones y los


alineamientos. Explique las diferencias que observó para los
alineamientos entre los diferentes valores para cada tipo de matriz
(BLOSUM y PAM). Explique las diferencias que observó entre las
matrices BLOSUM 30 vs PAM 10 y BLOSUM 90 vs PAM 500.
BLOSUM30 PAM10

Entre las BLOSUM y las PAM más bajas vemos como hay marcadas
diferencias, empezando por el largo de la cadena leída, siendo mayor en
PAM 10. Sin embargo, vemos como hay marcadas diferencias en cuanto a
los porcentajes de identidad y similaridad donde son mayores en BLOSUM
30, además de los porcentajes de GAPs que son mucho menores en
BLOSUM 30 que en PAM 10. Los puntajes se ve con una marcada
diferencia, donde el puntaje de BLOSUM 30 es el más alto, esto permite
inferir que en el caso de esta secuencia para realizar un alineamiento local
es mejor usar una matriz de BLOSUM más baja en comparación a una
matriz PAM baja debido a la divergencia de las secuencias.

BLOSUM90 PAM500

Para las BLOSUM y PAM más altas tenemos que en cuanto a los
porcentajes de identidad y similaridad hay semejanzas entre ellos donde no
hay una diferencia tan significativa, sin embargo en los porcentajes de GAPs
hay diferencias considerables, siendo en PAM 500 donde hay un porcentaje
más bajo (7.8%) y se ve reflejado en los puntajes finales por lo que podemos
deducir que es más apto usar una matriz PAM más alta para secuencias
divergentes como las dos usadas para este alineamiento.
● Establezca las diferencias que existen entre el alineamiento local y
global que realizó anteriormente, con la matriz BLOSUM62 para ambos
alineamientos.

En el caso de los alineamientos tanto globales como locales usando


BLOSUM62 con los parámetros que se que pone por default. Al hacer una
comparación de ambos resultados obtenemos:

Needleman Waterman

La longitud de la cadena de aminoácidos a alinear varía entre los algoritmos,


vemos que con Needleman es mayor la longitud de la cadena ya que toma el
total de los aminoácidos por ser un alineamiento global, mientras que con
Waterman es menor la longitud por ser un alineamiento local. Además en el
caso de Waterman se reduce el porcentaje de GAPs entre los alineamientos
y aumentan los porcentajes de identidad y similitud entre secuencias.

Esto se ve reflejado en los puntajes finales de ambos algoritmos, siendo


mayor el de Waterman (696.5 en comparación con Needleman con un total
de 682.0) por lo que podemos concluir que, en este caso, es mejor realizar
un alineamiento local ya que las secuencias tienen longitudes diferentes y
este puede llegar a reducir los errores y buscar un alineamiento más
conveniente por su capacidad de iniciar y terminar en cualquier lugar de la
secuencia.
3. Vaya al NCBI y descargue en formato FASTA las secuencias con los
siguientes identificadores: XM_001613435.1 y XM_004220695.1. ¿Diga
qué moléculas nucleotídicas son y a qué organismos corresponden?
Incluya pantallazo con las secuencias encontradas.

Esta secuencia nucleotídica es de ARNm parcial, perteneciente a un parásito


protozoario llamado Plasmodium vivax cofactor p47. Es un organismo
eucariota causante de la malaria benigna y fue aislado de la malaria humana
en pacientes desatendidos. La longitud de esta secuencia es de 1904 bp.

Esta secuencia nucleotídica es ARNm de secuencias codificantes completas


(CDS), es perteneciente al parásito Plasmodium cynomolgi cepa B cofactor
p47. Es un organismo eucariota. La longitud de la secuencia es de 561 bp.
4. Vaya al servidor EMBL-EBI y realice alineamientos utilizando las
secuencias de nucleótidos que acaba de descargar y responda las
siguientes preguntas (Incluya pantallazos para comprobar que realizó el
ejercicio)
● Haga un alineamiento global con estas dos
secuenciascon el algoritmo Needleman y otro local
usando algoritmo Smith-Waterman:

Al hacer el alineamiento con Needleman obtenemos un alineamiento global


de la siguiente manera:

Al hacer el mismo alineamiento usando el algoritmo de Smith-Waterman


obtenemos el siguiente resultado:
● ¿Cuáles son los porcentajes de identidad y similaridad de los
alineamientos?
En el algoritmo Needleman obtenemos un porcentaje de identidad y
similaridad de 25.8% para ambos.

Para el algoritmo Smith-Waterman se obtiene un porcentaje de identidad y


similitud de 68% para ambos.

● ¿Cuáles son los valores de penalización para los “gaps”, tanto


apertura como extensión?

Tanto para el algoritmo Needleman como para Smith-Waterman se tienen los


mismos valores de penalización para gaps de apertura como de extensión;
estos valores son de 0.5 para GAP extendido y 10 para apertura:

● Establezca las diferencias que existen entre los alineamientos local y


global que realizado anteriormente:

En el algoritmo de Needleman se obtiene una secuencia de alineamientos


más larga que la del algoritmo de Smith-Waterman, siendo la secuencia para
el primero de 1904 y de la segunda de 723 debido a que el segundo es un
alineamiento local donde únicamente se hace un alineamiento de una parte
específica de la secuencia de tal forma que se puedan reducir los GAPs y se
pueda aumentar el puntaje; en el caso de estas secuencias nos permite
llegar a la conclusión de que es mucho más conveniente realizar este
alineamiento (local) debido a que las secuencias tienen longitudes bastante
diferentes. Esto se ve basado en los porcentajes de GAPs donde los
porcentajes totales son bastante diferentes, siendo del 70.5% Needleman,
mientras que con Smith-Waterman es del 22,4% gracias a que es
únicamente un fragmento.

A pesar de estas diferencias, los puntajes en ambos algoritmos son iguales.


Needleman Waterman

● Si modifica los parámetros por default establecido, ¿qué resultados


obtiene en el alineamiento?

Hay que tener en cuenta que la matriz de default es en los dos algoritmos
anteriormente usados es BLOSUM62 y estos arrojaban resultados similares.
Se realizaron modificaciones en el algoritmo Needleman, cambiando la
matriz por BLOSUM 80 y disminuyendo las penalizaciónes por valores de 5
para GAPs de apertura y 0.2 para extendidos:

Al realizar el alineamiento obtenemos como resultado:

Podemos observar como hay una diferencia significativa en el puntaje


respecto a la matriz default (BLOSUM62) a pesar de que los porcentajes de
identidad, similaridad y GAPs son prácticamente iguales. El aumento de
puntaje se da debido al cambio de los valores de penalización, disminuyendo
estos respecto a los valores default.

Para el algoritmo de Waterman se realizó el cambio de la matriz BLOSUM


por una PAM 300 y de igual forma se disminuyeron los puntajes de
penalización para los GAPs
Se obtienen los siguientes resultados:

Con los cambios realizados se puede ver como el porcentaje de identidad


disminuye en una unidad respecto al alineamiento realizado con la matriz
default; contrario a esto el porcentaje de similaridad aumenta en 3 unidades
y los GAPs aumentan en una unidad. Finalmente vemos como el puntaje se
ve afectado, a pesar de no tener diferencias muy significativas, en el de la
matriz PAM 300 es menor a pesar de que los puntajes de señalización se
disminuyeron. Esto nos lleva a la conclusión de que esta matriz no es muy
adecuada para esta clase de alineamientos.

5.

Se realizaron cambios en algunas de las secuencias: en la primera


secuencia se usó la nueva versión de la secuencia para dicho gen
(NP_006735.2) y en la última secuencia correspondiente a E. coli también se
encontró que hay una nueva versión para la proteína requerida (P0A902.1)
● Evalúe los resultados obtenidos en el alineamiento múltiple usando el
algoritmo CLUSTAL-W:

Clustal Omega:

● Realice el alineamiento con las mismas secuencias utilizando las


herramientas T-Coffee y MUSCLE.

Secuencia Muscle:
Secuencia T-Coffee:

● Analice las diferencias obtenidas al utilizar las tres herramientas


(CLUSTAL-W, T-Coffee y MUSCLE) para realizar alineamientos
múltiples.

En la herramienta Clustal Omega, al realizar el alineamiento, los resultados


se observan con números en la parte derecha de las secuencias que indican
la cantidad de aminoácidos que hay en cada fila y que se han podido alinear
con los de las otras secuencias (no se cuentan los GAPs), mientras que con
las otras dos herramientas no se ven estos números, simplemente las
secuencias alineadas.

El órden de las secuencias a alinear es diferente en cada uno. En Clustal


Omega se hace el alineamiento clasificando las áreas con mayor similitud
que pueden estar asociadas a características específicas de otras regiones,
es decir, el órden de las secuencias se hace de acuerdo a sus regiones
conservadas más similares.Para MUSCLE se organizan las secuencias por
similaridad de nombre de la secuencia y T-COFFEE organiza por órden
alfabético.
A partir de lo visto, podemos concluir que el alineamiento más óptimo fue
realizado por la herramienta MUSCLE.

● Describa cuál es la estrategia que utilizan las herramientas de


alineamientos múltiples T-Coffee y MUSCLE:

Clustal Omega es una herramienta que puede producir alineamiento de


secuencias múltiples que son divergentes mostrando alineaciones
biológicamente significativas; las relaciones evolutivas se pueden ver
mediante los cladogramas o filogramas que se presentan. MUSCLE es más
precisa y más veloz que las otras dos herramientas ya que su precisión
media es más exacta y permite realizar estimaciones de árboles filogenéticos
y predicción de estructuras secundarias. En el caso de T-COFFEE, permite
combinar los resultados obtenidos con otros métodos de alineamiento, es
decir, va a combinar los resultados de alineamiento obtenidos con otras
herramientas y va a producir un nuevo alineamiento que tenga mejores
resultados; este compara las secuencias de dos en dos produciendo
alineamientos globales y una serie de alineamientos locales, finalmente
combinándolos en un alineamiento múltiple.

T-COFFEE utiliza un enfoque progresivo mientras que MUSCLE utiliza


Log-expectation.

● Explique que significan los asteriscos “*” que se muestran en el


alineamiento

El símbolo “*” indica las posiciones que tienen un único residuo totalmente
conservado. En otras palabras, esté símbolo nos da a entender que las
secuencias son conservadas y son idénticas entre sí.

Hay otros símbolos como “:” que nos da a entender que hay conservación
entre grupos que tienen propiedades fuertemente similares o que hay una
mutación pero está conservada. El “.” significa que hay una conservación de
propiedades débilmente similares o que hay mutaciones semi conservativas.

6. Seleccione 10 secuencias de nucleótidos de su interés EN


MICROORGANISMOS y realice el mismo procedimiento del punto 5
(¡¡¡RECUERDE ASUMIR HOMOLOGÍA ENTRE LAS SECUENCIAS AL
MOMENTO DE SELECCIONARLAS!!!):

Se realizó el alineamiento de 10 secuencias de nucleótidos del gen blaTEM


que es un gen que confiere resistencia a la ampicilina, penicilina y
cefalosporinas de primera generación como es el caso de la cefalotina. Este
gen codifica la enzima TEM-1 que es una betalactamasa que se ha descrito
con mayor frecuencia en bacterias Gram-negativas.

Los microorganismos de los que se obtuvo esta secuencia fueron: E. coli,


Pseudomonas stutzeri, Acinetobacter sp., Kluyvera georgiana, Klebsiella
oxytoca, Aeromonas sp., Aeromonas veronii, Pseudomonas aeruginosa,
Pantoea agglomerans y Enterobacter sp.

● Evalúe los resultados obtenidos en el alineamiento múltiple usando el


algoritmo CLUSTALW.

● Realice el alineamiento con las mismas secuencias utilizando las


herramientas T-Coffee y MUSCLE.
Secuencia T-Coffee:

Secuencia Muscle:
● Analice las diferencias obtenidas al utilizar las tres herramientas
(CLUSTAL-W, T-Coffee y MUSCLE) para realizar alineamientos
múltiples.

Se obtuvieron alineamientos bastante similares, todas las secuencias


comparadas tenían una longitud bastante similar y la gran mayoría de estas
regiones están conservadas y muy pocas regiones presentan GAPs entre
ellas. Las principales diferencias que se pueden ver en estos 3 alineamientos
son el órden en el que se ponen las secuencias al momento de alinearlas,
además de como con Clustal Omega se muestra la longitud de la cadena de
aminoácidos para cada una de las especies comparadas mientras que con
las otras dos herramientas esto no se ve. Otra de las diferencias que se
observan es el lugar donde se ubican los GAPs donde son variables
dependiendo de la herramienta usada ya que cada uno de estos se basa en
los registros evolutivos y se organizan dependiendo de la programación de
cada.

7. Seleccione 10 secuencias de aminoácidos de su interés EN


MICROORGANISMOS y realice el mismo procedimiento del punto 5
(¡¡¡RECUERDE ASUMIR HOMOLOGÍA ENTRE LAS SECUENCIAS AL
MOMENTO DE SELECCIONARLAS!!!):

Se realizó un alineamiento de 10 secuencias de aminoácidos de la proteína


carbapenemasa; los microorganismos que poseen esta proteína son
capaces de hidrolizar los antibióticos carbapenémicos y los hace resistentes
a una gran cantidad de antibióticos B-lactámicos y no B-lactámicos que
inhiben la síntesis de la pared celular.

Para realizar este alineamiento se obtuvo la secuencia de aminoácidos de la


proteína de Citrobacter koseri, Enterobacter cloacae, Gammaproteobacteria,
Pseudomonas aeruginosa, Klebsiella pneumoniae, Acinetobacter baumannii,
Aeromonas caviae, Enterobacter hormaechei, Escherichia coli y Salmonella
enterica.
● Evalúe los resultados obtenidos en el alineamiento múltiple usando el
algoritmo CLUSTALW:

Secuencia de Clustalw:

● Realice el alineamiento con las mismas secuencias utilizando las


herramientas T-Coffee y MUSCLE.

Secuencia T-coffee:
Secuencia en Muscle:

● Analice las diferencias obtenidas al utilizar las tres herramientas


(CLUSTAL-W, T-Coffee y MUSCLE) para realizar alineamientos
múltiples.

Las diferencias que vemos al realizar estos 3 alineamientos son que Clustal
arroja una secuencia más corta y con un alineamiento más óptimo donde las
diferencias entre las secuencias no son tan notables y el porcentaje de GAPs
es muy bajo; contrario a esta vemos como el alineamiento con T-COFFEE es
más largo ya que usa un enfoque progresivo a diferencia de MUSCLE.
Adicionalmente, como ya se había mencionado previamente, con Clustal
podemos ver la cantidad de aminoácidos que se alinean en cada secuencia,
con valores muy parecidos en cada una de las filas de los bloques.

8. A partir de la base de datos RefSeq del NCBI, recupere las secuencia de


aminoácidos que corresponden a los siguientes identificadores:
WP_034080264.1, WP_063865171.1, WP_032492472.1, WP_063865176.1,
WP_063865178.1, WP_063865173.1, WP_063865168.1, WP_032495187.1,
WP_011997479.1 y WP_213556171.1:

● Para cada secuencia indique: el tipo de molécula, el nombre de la


molécula, la especie de donde se obtuvo y la longitud.
Estas secuencias corresponden a aminoácidos de diferentes proteínas que
confieren resistencia a antibióticos en distintas especies microbianas. Esto
sirve como referencia para identificar los genes de resistencia a los
antimicrobianos de la Base de Datos Nacional de Organismos Resistentes a
los Antibióticos (NDARO)

● WP_034080264.1: Este identificador corresponde a la proteína subclase B1


metalo-beta-lactamasa VIM-11 perteneciente a Pseudomonas aeruginosa, es
una secuencia de la proteína que consta de 266 aminoácidos.

● WP_063865171.1: Este identificador corresponde a la proteína subclase B1


metalo-beta-lactamasa VIM-16 de Pseudomonas aeruginosa. Esta proteína
posee una longitud de 266 aminoácidos.

● WP_032492472.1: Este identificador corresponde a la proteína subclase B1


metalo-beta-lactamasa VIM-19 perteneciente a varias especies de la familia
Enterobacteriaceae; es una proteína de 266 aminoácidos.
● WP_063865176.1: El indicador pertenece al organismo Proteus mirabilis y
codifica para la proteína subclase B1 metalo-beta-lactamasa VIM-25 con una
longitud de 266 aminoácidos.

● WP_063865178.1: Este indicador es multiespecie y pertenece al género


Pseudomonas; codifica para la proteína subclase B1 metalo-beta-lactamasa
VIM-28 que tiene una longitud de 266 aminoácidos.

● WP_063865173.1: Este indicador pertenece a Pseudomonas aeruginosa y a


su proteína subclase B1 metalo-beta-lactamasa VIM-20 que tiene una
longitud de 266 aminoácidos.

● WP_063865168.1: Corresponde a la proteína subclase B1 de


metalo-beta-lactamasa VIM-13 de Pseudomonas aeruginosa. Esta proteína
tiene una longitud de 266 aminoácidos.
● WP_032495187.1: Pertenece a la proteína subclase B1
metalo-beta-lactamasa VIM-27 de Klebsiella pneumoniae que tiene una
longitud de 266 aminoácidos.

● WP_011997479.1: Pertenece a la proteína subclase B1


metalo-beta-lactamasa VIM-7 de Pseudomonas aeruginosa y tiene una
longitud de 265 aminoácidos.

● WP_213556171.1: pertenece a la proteína subclase B1


metalo-beta-lactamasa VIM-75 de Proteus mirabilis
Para estas 10 secuencias realice el mismo procedimiento del punto 5:

● Evalúe los resultados obtenidos en el alineamiento múltiple usando el


algoritmo CLUSTALW.

Clustal Omega:

● Realice el alineamiento con las mismas secuencias utilizando las


herramientas T-Coffee y MUSCLE.

Secuencia Muscle:

Secuencia T-Coffee:
● Analice las diferencias obtenidas al utilizar las tres herramientas
(CLUSTAL-W, T-Coffee y MUSCLE) para realizar alineamientos
múltiples:

En clustal se ve la diferencia de longitud entre una de las secuencias que


posee un aminoácido menos (GAP) en comparación con las otras; además
en MUSCLE y T-Coffee encontramos este mismo GAP en la secuencia con
el aminoácido menos. Podemos ver cómo a pesar de que es la misma
subclase de proteína en diferentes organismos, hay muchos lugares donde
no hay regiones completamente conservadas, por el contrario se observa
que hay regiones donde hay poca o muy poca similaridad por lo que son
semi conservativas.

● Explique que significan los asteriscos “*” que se muestran en el


alineamiento

El símbolo “*” indica las posiciones que tienen un único residuo totalmente
conservado. En otras palabras, esté símbolo nos da a entender que las
secuencias son conservadas y son idénticas entre sí.

Hay otros símbolos como “:” que nos da a entender que hay conservación
entre grupos que tienen propiedades fuertemente similares o que hay una
mutación pero está conservada. El “.” significa que hay una conservación de
propiedades débilmente similares o que hay mutaciones semi conservativas.

También podría gustarte